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Titel: Rekonfigurierbare Elemente 

15 



Definitionen 

20 Rekonfigurierbare Elemente werden abhangig von der auszufflhrenden Applikation 
unterschiedlich und applikationsentsprechend ausgestaltet. 

Die Aufgabe der Erfindung besteht darin, Neues fur die gewerbliche Anwendung 
berei tzus tellen . 

25 

Die Losung der Aufgabe wird unabhangig beansprucht. Bevorzugte 
Ausfuhrungsformen finden sich in den unteransprtlchen . 

Unter einer rekonf igurierbaren Architektur werden vorliegend Bausteine (VPD) 
30 mit konfigurierbarer Funktion und/ o der Vemetzung verstanden, insbesondere 
integrierte Bausteine mit einer Mehrzahl von ein- Oder mehrdimens i onal 
angeordneten arithmetischen und/oder logischen und/ Oder analog en und/ oder 
speichernden und/oder intern/extern vernetzenden Baugruppen, die direkt oder 
durch ein Bus system miteinander verbunden sind. 

35 

Zur Gattung dieser Bausteine zahlen insbesondere systolische Arrays, 
neuronale Netze, Mehrprozessor Systeme, Prozessoren mit mehreren Rechenwerken 
und/oder logischen Zellen und/oder kommunikativen/peripheren Zellen (10)/ 
Vernetzungs- und Netzwerkbausteine wie z.B. Crossbar-Schalter, ebenso wie 
40 bekannte Bausteine der Gattung FPGA, DPGA, Chameleon, XPUTER, etc. . 

Hingewiesen wird insbesondere in dies em Zusammenhang auf die folgenden 
Schutzrechte und Anmeldungen desselben Anmelders: 

P 44 16 881.0-53, DE 197 81 412.3, DE 197 81 483.2, DE 196 54 846.2-53, 
DE 196 54 593.5-53, DE 197 04 044.6-53, DE 198 80 129.7, DE 198 61 088.2-53, 
45 DE 199 80 312.9, PCT/DE 00/01869, DE 100 36 627.9-33, DE 100 28 397.7, 

DE 101 10 530.4, DE 101 11 014.6, PCT/EP 00/10516, BP 01 102 674.7, DE 196 51 
075.9-53 , DE 196 54 846.2-53, DE 196 54 593.5-53 , DE 197 04 728.9, DE 198 
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07 872.2 , DE 101 39 170.6 , DE 199 26 538.0 , DE 101 42 904.5 , , DE 102 06 

653.1 , DE 102 06 857.7 , DE 100 28 397.7 , DE 101 10 530.4 , DE 102 02 

044.2 , DE 101 29 237.6-53 , DE 101 42 904.5 , DE 100 50 442.6 , DE 101 35 
210.7-53 , EP 02 001 331.4 , 60/317,876 . Diese sind hiermit zu 

5 Of fenbarungszwecken vollumfanglich eingegliedert. 

Die o.g. Architektur wird beispielhaft zur Verdeutlichung herangezogen und im 
folgenden VPU genannt. Die Architektur besteht aus beliebigen arithmetischen, 
logischen (auch Speicher) und/oder Speicherzellen und/oder Vernetzungszellen 

10 und/oder kommuiiikativen/peripheren (10) Zellen (PAEs), die zu einer ein- Oder 
mehrdimensionalen Matrix (PA) angeordnet seia kBnnen, wobei die Matrix 
unterschiedliche, beliebig ausgestaltete Snellen aufweisen kann; auch die 
Bus syst erne werden dabei als Zellen verstanden. Der Matrix als ganzes oder 
Teilen davon zugeordnet ist eine Konf igurationseinheit (CT, Ladelogik) , die 

15 die Vernetzung und Funktion des PA konf igurier t . Die CT kann z. B. als 

dedizierte Einheit gem. PACT05, FACT10, PACT17 , ausgestaltet sein oder als 
Host-Mikroprozessor nach P 44 16 881.0-53 , DE 102 06 856.9 dem PA 
zugeordnet bzw. mit oder durch solche realisiert sein. 

20 

Stand der Technik 

Unterschiedliche PAE-Strukturen sind nach dem Stand der Technik bekannt. Die 
gebrauchlichsten sind durch DE 196 51 075.9-53 , DE 100 50 442.6 . sowie 
25 Chameleon CS2112 definiert. Weiterhin soil auf die bekannten FPGA-Zellen 
verwiesen werden. 

Aus dem universitaren Umfeld sind Zellstrukturen wie die DPGAs, RawMachine 
(DeHuon) , KressArrays (Kress, Una Kaiserslautem) , XFUTER (Bar tens tein, Uni 
30 Kaiserslautem) , sowie weitere Strukturen bekannt. 

Die nachfolgend beschriebenen Erweiterungen, die fur alle vorgenannten 
Stmkturen nutzbar sind, verbessem die Nutzbarkeit der Architektur en und 
PAE-Strukturen in komplexen insbe sender e auch stark sequentiellen und/oder 
35 wenig datenf luSorientierten Anwendungen. Weiterhin wird der Anschlufi an 
exteme Einheiten (z.B. Speicher und/oder Peripherie) vereinfacht und 
homogenisiert . 

40 

Indirekte Konf iguration 

In einer besonderen Ausftihrung einer PAE (IPAE) wird diese oder eine Gruppe 
von PAEs mit einera Speicher (RRAM) , vorzugsweise einer RAM- PAE gekoppelt. Die 
IPAE weist ein en eigenen internen Sequenzer auf oder ist mit einem Sequenzer 
45 bzw. Microcontroller mit einem bevorzugt limitierten, d.h. mit einer 

vergleichsweise geringen Anzahl an unterschiedlichen mOglichen Befehlen, 
ahnlich wie bei RlSC-Prozessozren und/oder bevorzugt vollstandigen 
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Befehlssatz (vgl. ARC Microprocessor) gekoppelt. Mit anderen Wort en wird 
bevorzugt ein RISC Prozessor mit einem moglichst kleinen Befehlssatz, der 
jedoch berechnungstheoretisch vollstandig ist, verwendet. In einer 
Ausftlhrungsvariante kann der Sequenzer auch durch eine Konf iguration einer 
5 oder mehrerer PAEs gebildet werden. Es kann der Sequenzer in seiner Funktion 
und seinem Ablauf vernal ten konf igurierbar ausgestaltet sein (wie 
beispielsweise nach dem Stand der Technik bekannt, z.B. durch EPS448 von 
Altera [ALTERA Data Book 1&93]). Der Sequenzer /Microcontroller kann auf 
Zustande (z.B. Statussignale, Ereignisse) in der IPAE und/ oder auf ZustSnde 

10 (z.B. auch Trigger) anderer PAEs, die mit der IPAE verbunden sind (z.B. Qber 
ein Bussystem) , reagieren. In einem Register der IPAE wird ein Pointer auf 
einen RRAM Speicherinhalt konfiguriert, z. B. kann der ProgramPointer Rpp 
kann wahrend des Reset-Zyklus auf die Startadresse des Codes gesetzt werden. 
Ein Adressgenerator im Sequenzer liest den durch den Pointer referenzierten 

15 Speicherinhalt aus dem RRAM und schreibt diesen (oder einen Teil dessen) 
entweder in ein, beispielsweise durch den Speicherinhalt adressiertes, 
Konfigurationsregister einer adressierten PAE oder nutzt den Speicherinhalt 
als Instruktion fur eine nachste Verarbeitung. Der Pointer wird durch den 
Adressgenerator entsprechend der Oblichen Arbeitsweise von Adresspointern 

20 inkrementiert und/oder dekrementiert und/ oder bei Sprungbef ehlen (JUMP, CALL, 
RETURN) neu gesetzt. Insoweit stellt der Speicher RRAM einen Codespeicher und 
in einer bevorzugten Ausftthrung auch Datenspeicher fur einen Sequenzer zur 
Verfttgung und/oder wird als solcher genutzt. Der Sequenzer kann frei Code aus 
dem Speicher (RRAM) lesen und in einer bevorzugten Ausftthrung auch Daten aus 

25 dem Speicher lesen oder in den Speicher schreiben. Insofern stellt der 
Speicher auch einen Datenspeicher fur den Sequenzer dar. 

Der RRAM Speicherinhalt kann von einer ubergeordneten Konf igurationseinheit 
(CT) geladen werden. In einer erweiterten Ausftthrung kann der Speicherinhalt, 
30 ggf . auch von der IPAE selbstandig, zusatzlich oder altemativ aus einem 

anderen (beispielsweise extemen) Speicher geladen oder an diesen geschrieben 
werden, z.B. uber einen AnschluS an ein Front end. 

In einer Ausftthrungsvariante kann der Speicher und/oder die IPAE einen 
35 direkten AnschluS (EXTBUS) an ein externes RAM und/oder exteme 10 besitzen. 
In einer dabei besonders bevorzugten Ausgestaltung kann der E3CTB0S uber eine, 
ggf. dedizierte, Verbindung des PAE- Bus sys terns an eine Interface-Baugruppe 
(IOAG) wie beispielsweise aus PACT03 oder PACT15 bekannt realisiert sein. Die 
Ansteuerung von Speicher (RAM) und/oder Peripherie (10) erfolgt dabei 
40 bevorzugt durch die Interface-Baugruppe. 

In einer besonders bevorzugten Ausgestaltung kann der RRAM selbstandig Code 
und/oder Daten fur den Sequenzer Uber den EXTBUS aus dem oder einem extemen 
RAM laden. Diese Funktion kann durch eigenstandige, im RRAM implementierte 
45 oder implementierbare Adressgeneratoren realisiert werden. Beispielsweise 

eignen sich EMA-Kontroller besonders fur diese Aufgabe, indem sie blockweise 
Daten zwischen den Speichern kopieren. Der Adressraura der zu lesenden Daten 
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und der Zieladressraum wird entsprechend gesetzt und der Kopiervorgang wird 
gestartet. Das Setzen kann durch die IPAE erfolgen. 

In einer hardwaremaSig aufwendigeren Losung kann die Funktion durch eine 
5 implementierte MemoryManagemenTJnit (MMO) realisiert sein, deren allgemeine 
Funktionsweise durch den Stand der Technik per se definiert und bekannt ist. 
Vorliegend arbeitet die bevorzugte MMO hier wie folgt: 

Der von der MMU verwaltete RRAM Speicher ist in mehrere Seiten (Pages) 
10 aufgeteilt. Jede Page enthalt Daten eines virtuellen Speicherraumes innerhalb 
eines externen Speichers. Beispielsweise konnen die hexadezimalen RRAM- 
Adressen OxOaOO. .OxOaff Daten des externen Speichers an den Adressen 
0xbdl3200. .0xbdl32ff en thai ten. Zur Verwaltung der Adressumsetzung wird eine 
Adressttbersetzungseinheit verwendet, die vorzugsweise durch in der RRAM-Zelle 
15 vorgesehene Lookup-Tabellen realisiert ist. Die MMD ist nun dazu 

vorgesehen,insbesondere einen groSen Speicherraum auf den sehr viel 
Kleineren des RRAM zu ttbersetzen. Dies geschieht vorliegend der art, dass 
Seiten je nach Bedarf von dem grofien Speicherraum in den Kleinen kopiert 
werden. Sobald eine Seite nicht raehr benfltigt wird, kann diese gelflscht 
20 und/ oder uberschrieben werden. Wenn die Daten auf der Seite verandert wurden, 
wird die Seite bevorzugt vor dem IiOschen/Oberschreiben in den groSen 
Speicherrraum zurtlckgeschrieben. 

Die Adressumsetzungseinheit arbeitet dann derart, dass ein hdherwertiger Teil 
25 der physikalischen Adresse (also die Adresse der Seite) in dem Lookup - 

Speicher abgelegt wird und auf die entsprechenden Daten der Seite im RRAM 

zeigt, sobald die Seite innerhalb des kleinen Speichers (RRAM) verfugbar ist. 

Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM, ist 

auch keine Referenz eingetragen. In diesem Fall muss die Seite erst von 
30 einera groSen (externen) Speicherraum in den RRAM kopiert werden. Hierzu kann 

eine andere, bevorzugt aktuell nicht verwendete Seite gemafi dem vorstehenden 

Ablauf uberschrieben werden. 

Das Kopieren kann dabei automatisiert, also ohne wesentliche Beteiligung 
35 durch den Sequenzer erfolgen, indem von der MMO ein DMA-Kontr o 1 1 er 

angesteuert wird. Die erf indungsgemafie MMCF des hier offenbarten RRAM ist 
daher mit einer Ansteuerung fur einen DMA-Kontroller versehen und/oder 
verbindbar. Diesem werden die entsprechenden Seitenadressen im RRAM und 
externen RAM, sowie die SeitengrOfce durch die MMU zur VerfOgung gestellt, z. 
40 B. indem sie in Register eingetragen werden. 

In einer moglichen und applikationsabhangig ggf . bevorzugten Ausfuhrung 
kCnnen mehrere EXTBUS-Interface implement iert sein. 

45 

In einer moglichen Ausfuhrung ist der RRAM in mehrere Segmente xinterteilt, 
die in unterschiedlichen Adressbereichen liegen. Die Segmente konnen 

4 



WO 03/036507 



PCT/EP02/10572 



beispielsweise fur einige der folgenden Funktionen aufgeteilt sein bzw. 
aufteilbar sein und insbesondere eine Grdfie aufweisen, die. die 
Implementierung aller oder einiger der folgenden Funktionen ermftglicht sowie 
entsprechende Steuerungen, die gegebenenf alls konf igurierbar sind, bevorzugt 
aber test implementiert sind, besitzen: 

Sequenzer-/Code-Speicher, Stack (z.B. f Or Registersatz) , Datenspeicher, Heap, 
IO-Puf f er, Puffer zu extemem RAM bzw. Cache, Lookup-Tabellen, 
Konfigurationen fur PAEs und/oder Busse, der Regis tersatz der IPAE. 
Je nach Funktion konnen dazu folgende Ansteuermechanismen vorgesehen und/oder 
konfiguriert sein: 

Sequenzer- /Code- Speicher: Pr ogr ammz eiger auf die entsprechenden 
Speicherstellen (Rpp) . 

Stack; Stackzeiger auf die oberste Speichers telle des Stack (Rsp) , 
gegebenenf alls auch ein FramePointer (Rfp) , wie er nach dem Stand der Technik 
(z. B. Intel Pentium) per se bekannt ist. 

Konfigurationen ftir PAEs und/oder Busse; Hierauf kann ein Zeiger innerhalb 
der CT und/oder - implement ierungsabhangig ein Zeiger innerhalb der 
Konfigurationssteuerung der PAE zeigen. 

Registersatz der IPAE: Sollte der Registersatz der PAE im Speicher 
untergebracht sein, wird dieser direkt durch die PAE bevorzugt 
hardwaretechnisch fest vorgegebenen adressiert. 

Die restlichen Speicherbereiche, wie Datenspeicher, Puffer, Tabellen etc. 
werden typischerweise und bevorzugt durch den Compiler oder programmierer 
25 aufgebaut. Die Adressierung dieser Bereiche erfolgt durch das auszufuhrende 
Programm und/oder Betriebssystem und wird innerhalb des Programmes und/oder 
Be triebs systems, ggf . unter Zuhilfenahme der Regis tersatzes und der AI»U des 
Sequenzers , berechnet . 

30 Der Registersatz der IPAE kann in einer besonderen Ausgestaltung ahnlich dem 
Registersatz von Transputern als Stack organisiert sein. Dadurch kann der 
Registersatz besonders klein und hardwaretechnisch effizient realisiert 
werden (typischerweise reichen 3 Register A, B und C aus) . Weiterhin ist aus 
der Transputertechnologie bekannt, dass Compiler effizient mit einem 

35 derartigen hardwaretechnisch kostengunstigen Registersatz arbeiten kOnnen. 
Ebenfalls kann der Registersatz optional im RRAM liegen. 

In einer Ausftthrung kann und wird der RRAM als Multi-Port Speicher ausgefuhrt 
sein. Multi-Port Speicher erlauben den ggf. auch gleichzeitigen Schreib- 
40 und/oder Lese-Zugrif f durch mehrere Speicherzugrif fseinheiten auf den 
Spei cher inhalt. Speicherzugrif fseinheiten konnen beispielsweise externe 
und/oder interne Peripherie, Prozessoren, andere PAEs sein. Die Funktion von 
Multi-Port Speichern ist nach dem Stand der Technik ebenfalls bekannt. 

45 In einer besonderen Ausfiihrung kann die IPAE mit dem RRAM als lokale und ggf. 
auch globale Konf igur at ions einheit ahnlich einer CT fur PAEs in der Umgebung 
arbeiten oder unter anderem diese Funktion mit erf alien. Bevorzugt arbeitet 
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die PAE nach dem aus DE 196 54 846.2-53 bekannten Verfahren bei der 
Verwendung als lokal Konfigurationseinheit. Wird die PAE als globale 
Konfigurationseinheit verwendet, Oder sind sehr viele lokale PAEs zu 
konf igurieren, wird bevorzugt das Verfahren nach DE 196 54 593.5-53 

5 verwendet, das eine FILMD-Funktionalitat aufweist und daher sehr viele und 
auch voneinander unabhangige Konfigurationen verwalten kann. 
Die IPAE adressiert, z. B. gesteuert durch den Sequenzer/ Microcontroller, 
Konfigurationen im RRAM und konf iguriert diese an PAEs und/oder sich selbst 
und/oder bestimmt den Ablauf des Sequenzer s /Microcontrollers. Bevorzugt 

10 f indet hierbei eine Synchronisation mit einer ttbergeordneten CT ahnlich der 
bekannte Inter-CT-Protokolle (DE 198 07 872.2, DE 100 28 397.7 , DE 199 26 
538.0 ) statt. Die IPAE REAM Schaltung kann Konf iguration uber eines der 
EXTRAM- Interface selbst laden und/oder Konfigurationen von einer 
ttbergeordneten CT uber das CT Interface anfordern. Die Funktionsweise kann 

15 ahnlich der Rekonf igurationseinheit in DE 196 54 846.2-53 sein. Die 
Konfigurationsdaten fur die PAEs werden durch die IKAM an die PAEs 
weitergeleitet Oder in einer bevorzugten Ausgestaltung direkt von RRAM. Zur 
Auf teilung der Daten im REAM an mehrere PAEs kann dabei ein 
Busverteilverfahren ahnlich des in DE 101 10 530.4 beschriebenen SIMD- 

20 Bussys terns verwendet werden. 

Mit anderen Worten ist die prinzipielle Arbeitsweise einer IPAE RRAM 
Ver schaltung ahnlich einem Microcontrollersy-stem, des sen Busanbindung 
und/oder dessen Daten transfer und/oder dessen Programmablauf einem VPtJ- System 
25 entspricht . 

Es wird insbesondere Schutz fttr IPAE-RRAM-Verschaltungen beansprucht, bei 
denen die IPAE und das RRAM jeweils als separate Funktionselemente (PAEs) 
eines rekonfigurierbaren Bausteins ausgestaltet sind und typischerweise 
30 beliebige Verschaltungen und Funktionen ausfuhren konnen, aber jedoch 

speziell zum Einsatz der erf indungsgemafi beschriebenen Sequenzerstruktur aus 
IPAE und RRAM entsprechend konf iguriert und verwendet werden kfinnen. Die 
Konf iguration erf olgt dabei bevorzugt durch die ttbergeordnete 
Konfigurationseinheit CT. 

35 

Ebenfalls wird Schutz beansprucht fur PAEs, die zusatzlich zu ihrem Anschluss 
an die internen Bussysteme des Arrays aus PAEs einen dedizierten Anschluss 
(IO-Channel) an ein ttberregionales Bussys tern aufweisen, das insbesondere 
Daten uber lange Strecken innerhalb des Arrays ttbertragt und/oder 

40 insbesondere direkten Anschlufi an die Peripherie aufweist. Der Anschlufi an 
die Peripherie kann dabei direkt erfolgen, indem z. B. das Bus system bereits 
dem peripheren Protokoll entspricht Oder uber entsprechende Protokollwandler 
zur tfmsetzung des Protokolls erfolgen. Das dedizierte Bussystem kann dabei 
bereits einem Indus triestandard entsprechen, z. B. PCI, RapidIO, Firewire, 

45 tJSB, Ethernet, RAMBUS, DDR- RAM etc. um somit einen einfachen und 

unaufwendigen Anschluss der peripheren Gerate zu ermaglichen. Oegebenenfalls 
kOnnen auch in zwischengeschalteten IOAGs (vgl. DE 196 54 595.1-53 ) 
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Protokollkonvertierungen derart durchgeftlhrt werden, so dass ein internes 
vereinfachtes und ggf. proprietares Busprotokoll auf ein oder mehrere 
komplexere exfceme Standardprotokolle tibersetzt werden. 
Es soil besonders darauf hingewiesen werden, dass unter Peripherie auch 
5 Speicher verstanden werden, wie bei den bereits aufgezahl ten Busprotokoll en 
verdeutlicht wird. 

Ebenfalls ist erf indungsgemafi besonders relevant, dass PAEs auch mehrere 
Anschlttsse an dedizierte Bus syst erne aufweisen k6nnen. 

10 

Desweiteren sind anwendungsabhangig auch Architekturen sinnvoll, bei denen 
nur eine Teilmenge der PAEs Anschlttsse an ein dediziertes Bus system aufweist, 
oder unterschi edliche PAEs mit einer unterschiedlichen Anzahl von Anschlttssen 
an ggf. auch unterschiedliche dedizierte Bussysteme aufweisen. 

15 

Im folgenden wird eine detaillierte Beschreibung einer Ausftthrungsvariante 
der erfindungsgemafien Kopplung von IPAE und RRAM ausgefuhrt: 

Es wird erf indungsgem&B bei einem in Funktion und/ oder Verne tzung 

20 insbesondere zur Lauf zeit ohne Storung nicht zu rekonf igurierender Elemente 
rekonf igurierbaren Zellelementefeld zur Datenverarbeitung mit Funktionszellen 
zur Ausftthrung algebraischer und /oder logischer, konfigurierbarer Punktionen 
und Speicherzellen, urn Informationen zu empfangen, abzuspeichern und /oder 
auszugeben vorgeschlagen, daB eine Steuerverbindung (CMD) von den 

25 Funktionszellen zu den Speicherzellen geftthrt ist. Diese Steuerverbindung 

dient dazu, die Adress- und /oder Datenein/ausgabe aus dem Speicher durch die 
zugeordnete Punktionszelle, typisch einer ALU-PAE, steuerbar zu machen. So 
kann etwa angegeben werden, ob die nachste ttbertragene Information als 
Adresse oder als Daten behandelt werden soli und ob ein I»ese- und/oder 

30 Schreibzugriff erforderlich ist. Diese Datenubertragung aus der 

Speicherzelle, bei der es sich etwa urn eine RAM-PAE handeln kann, auf die 
ALU-PAE erlauben dann, dafi neue, von der ALU abzuarbei tende Befehle in diese 
geladen werden konnen. Es ist auf diese Weise moglich, lediglich durch 
Vorsehen einer dedizierten und dediziert funktionszellenkontrollierten 

35 Steuerverbindung zwischen Punktionszelle und Speicherzelle bereits mit nur 
zwei Element en, die ttber geeignete Busse verbunden sind, eine 
Seguenzerstruktur in einem Zellelementefeld aufzubauen, ohne dafi ansonsten 
weitere Mafinahmen und/oder bauliche Veranderungen erforderlich sind. In der 
Speicherzelle konnen Daten, Adress en, Programmschritte usw. in per se aus 

40 herkommlichen Prozessoren bekannter Weise abgelegt werden. Weil beide 

Elemente auch in anderer Weise bei entsprechender Konf iguration einsetzbar 
sind, ergibt sich eine besonders effiziente Bauweise, die sowohl 
Seguenzerstrukturen als auch vektoriellen und/oder pa- rallelisierbaren 
Strukturen besonders gut anpaEbar ist. 

45 

Es ist einsichtig, daS durch die Verwendung von lediglich zwei Zellen in 
einem Zellelementefeld, nSmlich der Punktionszelle und der 

7 
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Informationsbereitstellungszelle eine Vielzahl von sequenzerartigen 
Strukturen in dem rekonf igurierbaren Zellelementef eld aufgebaut werden kann. 
Dies ist insofern vorteilhaft, als oftmals bei der Datenverarbeitung, etwa in 
einem multitaskingfahigen Be triebs system, eine Reihe unter schi edl icher und 
voneinander per se vers chi edener An f gab en abgearbeitet werden rauS. Es konnen 
dann eine Vielzahl derartiger Aufgaben in einem einzigen Zellelementef eld 
effektiv gleichzeitig abgearbeitet werden. Die Vorteile fttr 
Echtzeitanwendungen sind of fensichtlich. Welter ist es auch moglich, die 
einzelnen Sequenzerstrukturen, die in einem Zell- elementefeld unter 
Vorsehung der erf indungsgem&Sen S teuerverb indung aufgebaut werden, mit 
unterschiedlichen Taktraten zu betreiben, etwa um den Stromverbrauch dadurch 
zu senken, daS Aufgaben mit geringerer Prioritat langsamer abgearbeitet 
werden. Es ist uberdies moglich, bei der Ausfuhrung per se weitgehend 
paralleler Algorithmen sequenzerartige Programmteile in dem Feld parallel 
oder vektoriell abzuarbeiten und umgekehrt. 

Das Zellelementefeld mit den in Punktion und/oder Vernetzung konf igurierbaren 
Zellen kann einsichtigerweise einen Prozessor, einen Coprozessor und/oder 
einen Mikrocontroller bilden, bzw. eine parallele Vielzahl oder Kombinationen 
derselben . 

Die Funktionszellen sind typisch als arithmetische Iiogikeinheiten gebildet, 
wobei sie insbesondere grobgranulare Elemente darstellen, die aber mit einer 
feingranularen Statemachine versehen sein konnen. In einem besonders 
bevorzugten Ausfuhrungsbei spiel handelt es sich'bei den ALUs um sogenannte 
erweiterte ALUs (EALU) , wie diese in den f ruheren Anmeldungen des 
vorliegenden Anmelders beschrieben wurden. Eine Erweiterung kann insbesondere 
die Steuerleitungskontrolle, Bef ehlsdekodiereinheit etc. umfassen, soweit 
erf orderlich . Es soli darauf hingewiesen werden, dass grundsatzlich zumindest 
eine Teilmenge der Funktionszellen auch aus feingranularen FPGA-Elementen 
aufgebaut sein kann. 

Die Spei cher zellen kOnnen Da ten und/oder Informationen f luchtig und/oder 
nichtflQchtig speichern. Wenn in den Speicherzellen abgelegte Informationen, 
seien es Programmschritte, Adressen fttr einen Zugriff auf Daten oder 
regis terartig bzw. heap-artig abgelegte Daten als flttchtige Daten abgelegt 
sind, so kann eine vollstandige Rekonfiguration wahrend des Betriebes 
erfolgen. Alternativ ist es moglich, nicht flttchtige Speicherzellen 
vorzusehen. Die nichtflttchtigen Speicherzellen kdnnen etwa als EE-Prom- 
Bereich und dergleichen vorgesehen werden, in die ein rudimen tares Bios- 
Programm abgelegt wird, das bei Inbetriebnahme der Anordnung auszuftthren ist. 
Auf diese Weise kann ohne weitere Bauteile eine Inbetri ebn a hm e einer 
Datenverarbeitungseinrichtung erfolgen. Ein ni chtf lttchtiger Datenspeicher 
kann auch dann vorgesehen werden, wenn aus Kosten- und /der Raumgrttnden 
beschlossen wird, dafi immer wieder dieselben Programmteile auszuftthren sind, 
wobei dann auch unter solchen f est en programmteilen, etwa nach Art der WAVE- 
Rekonfiguration, im Betrieb gewechselt werden kann. Die MBglichkeiten, 

8 
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derartige nichtf luchtige Speicher vorzusehen und zu verwenden, sind 
Gegenstand anderer Schutzrechte des Anmelders. Eg ist mdglich, sowohl 
fluchtige als auch nicbt fluchtige Daten in den Speicherzellen abzuspeichern, 
etwa um ein Bios-Prograinra f est abzulegen und die Speicherzelle dennoch fur 
5 andere Zwecke nutzen zu konnen. 

Die Speicherzelle ist bevorzugt so ausgebildet, daS sie eine hinreichende 
Vielzahl von zu verarbeitenden Daten und/oder abzuarbeitenden Prograramteilen 
speichem kann. Es sei dabei darauf hingewiesen, dafi diese Programmteile 

10 sowohl als Programmschritte ausgebildet sein konnen, die jeweils vorgeben, 
was eine einzelne, insbesondere die zugeordnete PAE, also insbesondere die 
die Speicherzelle steuernde Funktionszelle, im nachsten Schritt zu tun hat, 
als auch ganze Konfigurationen fur Feldbereiche oder andere Felder beinhalten 
kann. In einem solchen Fall ist es ohne wei teres moglich, dafi die aufgebaute 

15 Sequenzerstruktur einen Befehl ausgibt, auf Grund dessen eine Rekonf iguration 
von Zel lei ementefeldberei chen erfolgt. Damit arbeitet die diese Konf iguration 
auslosende Funktionszelle dann zugleich als Ladelogik (CT) • Es sei darauf 
hingewiesen, dafi die Konf iguration von anderen Zellen wiederum dergestalt 
erfolgen kann, daS dort eine sequenzerartige Datenverarbeitung erfolgt und es 

20 ist in diesen Feldern wiederum moglich, andere Zellen im Verlauf der 

Programmarbeitung zu konf igurieren bzw. rekonf igurieren. Damit ergibt sich 
ein iteratives Konf igurieren von Zellelementebereichen und ein Einschachteln 
von Programmen mit Sequenzer- und Parallel-Strukturen, die ahnlich ineinander 
geschachtelt sind wie eine Babuschka. Es sei darauf hingewiesen, dafi hier 

25 insbesondere durch Ein-Aasgabezellen ein Zugrif f auf weitere 

Zell el ementef elder aufierhalb eines einzelnen integrierten Bausteines erfolgen 
kann, was die Gesamtrechenlei stung massiv erhohen kann. Es ist insbesondere 
moglich, bei Auftreten von Konfigurationen in einem Codeteil einer in ein 
Zellel ementef eld hineinkonfigurierten Sequenzerstruktur gegebenenfalls 

30 entweder die Konf igurationsanforderungen auf einem zugewiesenen 

Zellelementefeld, das von der jeweiligen Sequenzerstruktur allein verwaltet 
wird, durchzufuhren und/oder es kOnnen derartige Anf orderungen an eine 
Konf igurations -Mas tereinheit abgegeben werden, um sicherzustellen, dafi eine 
gleichmaEige Belegung aller Zellelementef elder erfolgt. Es ergibt sich somit 

35 quasi ein unterprogrammaufruf durch tJbergabe von erf order lichen 

Konfigurationen an Zellen oder Ladelogiken. Dies wird fur sich als 
schutzwurdig angesehen. Es sei auch darauf hingewiesen, dafi die Zellen, 
sofem sie selbst fur die Konfiguration anderer Zellelementfeldbereiche 
Zustandigkeit besitzen, mit hard- oder sof twareartig implementierten FILMO- 

40 Strukturen und dergleichen zur Sicherstellung einer ordnungsgemafien 

Rekonf iguration versehen sein konnen. Auf die MOglichkeit, die Speicherzellen 
wahrend der Abarbeitung von Befehl en der art zu beschreiben, dafi sich der 
abzuarbeitende Code bzw. das abzuarbeitende Programm andert, sei hingewiesen. 
In einer beeonders bevorzugten Variante ist diese Art der Selbstmodifikation 

45 (SM) aber durch eine entsprechende Steuerung tlber die Funktionszelle 
unterdruckt . 
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Es ist moglich, die Speicherzelle abgespeicherte Information hier auf die 
Ansteuerung der sie steuemden Funktionszelle direkt oder indirekt auf einen 
zur Funktionszelle fuhrenden Bus gibt. Die indirekte Ausgabe kann 
insbesondere dann erfolgen, wenn beide Zellen benachbart liegen und die durch 
5 Ansteuerung angef order te Information an die ALU- PAE uber ein Bussegment 
eintref fen mu£, das nicht unmittelbar mit dem Ausgang der Speicherzelle . 
verbunden werden kann. In einem solchen Fall kann die Speicherzelle Da ten auf 
dieses Bussystem insbesondere uber Ruckwartsregister (Backward-Register) 
ausgeben. Es ist daher bevorzugt, wenn zumindest eine von Speicherzelle 

10 und/ Oder Funktionszelle ein solches Backward-Register aufweistr welches im 
Informationsweg zwischen Speicherzelle und Funktionszelle angeordnet werden 
kann. Diese Register brauchen in einem solchen Fall nicht zwingend mit 
we iter en Funktionalitaten versehen sein, obwohl dies etwa bei Anforderung von 
Da ten aus der Speicherzelle fur die welter e Verarbeitung, entsprechend einem 

15 herkaramlichen LOAD-Befehl eines typischen Mikroprozessors, zur Veranderung 
der Daten noch vor dem Hineinladen in die PAE ohne wei teres denkbar ist, ura 
z. B. einen Befehl LOAD++ zu realisieren. 

Mit anderen Wort en werden innerhalb der beschriebenen Struktur 
Busverbindungen bei Bedarf durch die in der XPP-Technologie des Anmelders 

20 typischen Forward ( FREG) - und Backward (BREG) -Register gefuhrt. Diese besitzen 
die Moglichkeit Daten zwischen horizontalen Bussystemen vertikal zu 
ubertragen und kOnnen mehrere Busse multiplexen oder demultiplexen. Der 
Vollstandigkeit halber sein darauf hingewiesen, dass FREG und BREG (entgegen 
ihrer Namensgebung) nicht zwangslaufig Regis terstuf en darstellen, sondern 

25 lediglich optional und ggf . konfigurierbare Register aufweisen. 

Die Steuerverbindung (CMD) kann dabei an FREG und/ oder BREG der jeweiligen 
Funktions zellen (PAEs) gefuhrt werden, urn die Busdat en transfers entsprechend 
des aktuell ausgefuhrten Befehls zu steuera. 

30 Die Speicherzelle wird bevorzugt dazu angeordnet sein, Inf ormationen von der 
sie steuernden Funktionszelle zu empfangen, wobei auch weiter ein 
Informationseinspeichern uber eine Ein-Ausgabezelle und/oder eine die 
Speicherzelle nicht steuernde Zelle moglich ist. Insbesondere dann, wenn 
Daten von einer Ein-Ausgabezelle in die Speicherzelle geschrieben werden 

35 sollen, ist es bevorzugt, wenn auch diese Ein-Ausgabezelle (I/O-PAE) von der 
Funktionszelle gesteuert wird. Dabei kann etwa die Adresse, bei welcher eine 
in die Speicherzelle zu schreibende oder gegebenenf alls auch direkt an die 
Funktionszelle (PAE) zu ubertragende Information zu lesen ist, an die I/O-PAE 
von der ALU- PAE ubermittelt werden. Es sei in diesem Zusammenhang darauf 

40 hingewiesen, da& diese Adresse uber eine Adrefiubersetzungstabelle 

(Adres s trans la ti on table ) , einen Adresstranslationbuf f er oder eine MMU-artige 
Struktur in der I/O-PAE festgelegt werden kann. Es ergeben sich insbesondere 
in einem solchen Fall die vollen Funktionalitaten typischer Mikroprozessoren. 

45 Die Funktionszellen-Speicherzeaienkombination ist demnach in einer 

bevorzugten Variante zumindest ein Ein-Ausgabe-Mittel zugeordnet, mit welchem 
dann an eine exteme Einheit, eine andere Funktionszelle, Funktions zellen- 

10 
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Speicherzellen-Kom-bination una/ Oder Speicherzellen Information gesandt 
und/oder von dieser erapfangen werden kaxm. 

Die Ein-Ausgabe-Einheit wird dabei bevorzugt gleichfalls zum Empfang von 
5 Steuerbefehlen aus der Funktionszelle ausgebildet. 



Die Funktionszellen-Speicherzellenkombination weist bevorzugt 
DatentransfermSglichkeiten an die ubrigen Funktionszellen und/oder 
Speicherzellen eines VPU-Bausteines auf, insbesondere solchen, die sich im 
10 Array aus PAEs (PA) befinden. Hierzu werden Zugrif fsmBglichkeiten Ober die 
Bussysteme auf die entsprechenden Zellen zur VerfOgung gestellt. Der Zugrif f 
erfolgt bevorzugt tiber die Forward- und/oder Backward-Register der PAEs der 
Funktionszellen-Speicherzellenkombination, durch die flbertragung der "Porf- 
Steuerkommandos . 



20 



25 



In einer bevorzugten Variante ist die Steuerverbindung (CMD) dazu 
ausgebildet, zumindest einige und bevorzugt alle der nachfolgenden 
Steuerkommandos zu Obertragen : 

OPCODE FETCH, 

INTERNE / EXTERNE DATENZUGRI FFE , 

POSITIONIERUNG VON INTERNEN/EXTERNEN ADRESSPOINTERN, 
POSITIONIERUNG VON INTERNEN/EXTERNEN PROGRAMMPO INTERN, 
PROGRAMMPO INTER INCREMENT, 

POSITIONIERUNG VON INTERNEN/EXTERNEN STACKPO INTERN, 
STACXZUGRIFFE (PUSH, POP) 



30 



35 



45 



Beispielsweise kann diese Funktionalit&t durch folgende CMD Steuerkommandos 
implementiert werden: 



load_const: 
writejftapt 

readJRap : 

readJReg : 

write_Reg: 



40 write&decr_Rsp : 



read&incr_Jtep : 



setJRpp: 
set&push^Rpp: 



Lade eine Konstante in ein Register 
Setze Adress Pointer f(ir Speicherzugrif fe 
(z. B. Heap) 

Lese Adress Pointer ftir Speicherzugrif fe 
(z. B. Heap) . . 

Lese ein Register aus dem Speicher (wenn Register in der 
RAM-PAE implementiert sind) 

Schreibe Daten in ein Register im Speicher (wenn Register 
in der RAM-PAE implementiert sind) 

Schreibe ein Datenwort auf den Stack und dekrementiert 
den Stackpointer 

Lese ein Datenwort vom Stack und inkrementeiere den 

Stackpointer 

Setze Programmpo inter 

Schreibe Programmpointer auf Stack und setze 
Programmpo inter neu 



11 



WO 03/036507 PCT/EP02/10572 



Die Steuerkoinmandos dienen der Steuerung der angeschlossenen Speicherzellen 
und Funktions zellen (PABs). Weiterhin steuem die Steuerkonmiandos den 
Datentransfer auf den Bussystemen, beispielsweise durch Ansteuerung von 
Multiplexern, Switches, Transmission Gates, o. a. in den Forward- und 
5 Backward-Registem (FREG/BREG) . Weitere Befehle sind z. B. : 

reacLPort: Lese Daten von einem Port (beispielsweise implementiert 

durch ein PRE6) zum Array 
write_Port: Schreibe Daten auf einen Port (beispielsweise 

implementiert durch ein BRE5G) zum Array 

10 

Dies kann durch eine entsprechende Bitbreite der steuerleitung und eine 
zugeordnete Decodierung bei den Empfangern erfolgen. Die jeweils 
erforderlichen Steuer- und Dekodiermittel konnen problemfrei und 
kostengtinstig vorgesehen werden. Wie ersichtlich, ergibt sich mit den 
15 Signalen eine praktisch vollstandige Sequenzerfahigkeit der Anordnung. Dafi 
auf diese Weise eine Allgemeinzwec)cprozessordatenverarbeitungseinheit 
erhalten wird, sei erwahnt. 

Die Anordnung wird typisch so gewShlt sein, dafi die Funktionszelle als 
20 alleiniger Master auf die Steuerverbindung und/oder ein als Steuerverbindung 
dienendes Bus segment bzw. Bus system zugreifen kann. Es ergibt sich somit eine 
Anordnung, bei der die Steuerleitung als Command-Lei tung wirkt, wie sie in 
herkommlichen Prozessoren vorgesehen ist. 

25 Die Funktionszelle und die Speicherzelle bzw. I/O-Zelle sind bevorzugt 

benachbart angeordnet. Unter benachbart kann dabei wie bevorzugt verstanden 
werden, dafi die Zellen unmittelbar nebeneinander angeordnet sind. Alternativ 
befinden sie sich zumindest dicht beieinander. Die Anordnung der Funktions- 
und Speicherzellen in Nachbarschaf t zueinander sorgt daftir, daB keine, 

30 jedenfalls keine signif ikanten Latenzzeiten zwischen Ansteuerung und 

Dateneingang der angef order ten Information in der Funktionszelle auftreten, 
nur weil die Verbindungen zwischen den Zellen zu lang sind. Dies sei als 
,direkt* verstanden. MUssen Latenzzeiten bertlcksichtigt werden, so kann auch 
ein Pipelining in den Sequenzerstrukturen vorgesehen werden. Dies wira 

35 besonders wichtig bei sehr hoch getakteten Anordnung en . Es sei darauf 

hingewiesen, dafi es ohne weiteres mOglich ist, entsprechend hochf requent 
getaktete Zelleinheiten vorzusehen, die wie im Stand der Technik per se 
bekannt, auch entsprechend schnell auf geeignete Speicherzellen zugreifen 
konnen. Auch in einem solchen Fall, etwa wenn per se bekannte 

40 Architekturelemente ftlr die Funktions zellen verwendet werden, wird 

gleichzeitig eine Rekonfigurierbarkeit des Funktionszellenelementes und der 
zugehdrigen Vemetzungen vorzusehen sein. In einer besonders bevorzugten 
Variante sind die Funktionszellen, die Informationsbereitstellungszellen wie 
Speicherzellen, I/O-Zellen und dergleichen multidimensional angeordnet, 

45 insbesondere nach Art einer Matrix bzw. auf Gitterpunkten eines 

eindimensionalen Gitters usw. Wenn eine regelmaSige Struktur vorliegt, wie 
dies dort der Fall ist, wird einer Zelle typisch aus einer ersten Reihe 
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Information, das hei&t Operanden, Konfigurationen, Triggers ignale usw. 
zugeftthrt, wahrend in einer darunterliegende Reihe Da ten, Triggersignale und 
andere Informationen abgegeben werden. In einem solchen Fall wird es 
bevorzugt sein, wenn die Zellen in ein und derselben Reihe liegen und es kann 
5 dann der Informations transfer aus der Inf ormationsbereitstellungszelle in den 
erforderlichen Eingang der Funktionszelle Gber ein Backward-Register 
erfolgen. Die HBglichkeit, die Register ftlr Pipelining zu benutzen, sei 
erwahnt . 



10 Es wird weiter Schutz beansprucht fur ein Verfahren zum Betrieb eines 

Zellelementefeldes, insbesondere multidimensional en Zellelementefeldes mit 
Funktionszellen zur Ausftihrung algebraischer und/oder logischer Function en 
und Informationsbereitstellungszellen, insbesondere Speicherz ellen und/oder 
Ein -Ausgabe zellen zum Empfangen und/oder Ausgeben von Informationen und/oder 

15 Speichem derselben, wobei zumindest eine der Funktionszellen Steuerbef ehle 
an zumindest eine Inf ormationsbereitstellungszelle ausgibt, dort im 
Ansprechen auf die Steuerbef ehle Information fur die Funktionszelle 
bereitgestellt wird und die Funktionszelle dazu ausgebildet ist, die weitere 
Datenverarbeitung im Ansprechen auf die bereitgestellte Information 

20 durchzufflhren, urn so sequenzerartig Daten zu verarbeiten. 

Es wird also in einem rekonf igurierbaren Feld durch die Ausgabe der 
Steuerbef ehle an die Speicherzelle einer Sequenzerstruktur eine 
sequenzerartige Datenverarbeitung ermoglicht. Die Befehle, die als 
Steuerbef ehle von der Funktionszelle ausgegeben warden k6nnen, ermOglichen 
dabei einen sequenzerartigen Betrieb, wie er aus herkommlichen Prozessoren 
bekaimt ist. Es sei darauf hingewiesen, daS es ohne wei teres moglich ist, nur 
Telle der genannten Befehle zu implementieren und dennoch eine vollstandig 
sequenzerartige Datenverarbeitung zu gewfihrleisten. 

Die vorstehende AusfChrungsvariante wird im folgenden noch einmal und 
beispielsweise anhand der Zeichnungen beschrieben. In dieser ist gezeigt 
durch: 



Fig. 1 ein erf indungsgemalSes Zellelementef eld, 

Fig. 2a ein Detail hiervon, 

Fig. 2b, c das Detail von Fig. 2a wahrend verschiedener 

Datenverarbeitungs zei ten. 
Fig. 3a eine alternative Aus fuhrungs form des Details 

von Fig. 2, 

Fig. 3b eine besonders bevorzugte Variante des 

Details. 

Fig. 4 Grundaufbau einer Funktions-/ Speicherzelle 

(PAE) 

Fig. 5 eine Ausgestaltungsvariante von Fig. 3b 
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Nach Fig. l(a/b) umfaSt ein allgemein mit 0101 bezeichnetes Zellelementef eld 
zur Datenverarbeitung 0101 Funktionszellen 0102 zur Ausfuhrung von 
arithmetischen und/oder logischen Funktionen sowle Speicherzellen 0103, urn 
Infonnationen zu empfangen, abzuspeichern und/oder auszugeben, wobei eine 
5 Steuerverbindung 0104 von Funktionszellen 0102 zu den Speicherzellen 0103 
gefuhrt 1st. 

Zunachst wird die Arbeitsweise von Fig. la beschrieben. Fig. lb stellt eine 
bevorzugte Ausgestaltung und Anordung der Funktionszellen und Speicherzellen 
10 dar. 

Das Zellelementef eld 0101 ist in der Vemetzung der Elemente 0102, 0103, 0104 
frei konfigurierbar, und zwar ohne den laufenden Betrieb nicht neu zu 
konfigurierender Zellelementeteile zu storen. Dabei konnen die Verbindungen 
konfiguriert werden, indem Bussysteme 0105 wie erforderlich geschaltet 

15 werden. Weiter sind die Funktionszellen 0102 in ihrer jeweiligen Funktion 
konfigurierbar. Bei den Funktionszellen handelt es sich um arithmetische 
Logikeinheiten, die um bestimmte, Rekonfiguration ermSglichende Schaltkreise 
erweitert sind, wie Statemachines, Schnittstellenbeschaltung zur 
Koinraunikation mit der bevorzugt auBerhalb des Zellelementefeldes angeordneten 

20 Ladelogik 0106 usw. Auf die entsprechenden Voranmeldungen des Anmelders wird 
hingewiesen. 

Die Zellelemente 0102, 0103 des Zellelementefeldes 1 sind zweidimensional in 
Reihen und Spalten angeordnet, wobei jeweils eine Speicherzelle 0103 

25 unmittelbar neben einer Funktionszelle 0102 liegt und hier je Reihe drei 

Spei cher zellen-Funkt ions zellen-Paare vorliegen, in den en die Funktions- und 
Speicherzellen jeweils uber Steuerverbindungen 0104 miteinander verbunden 
sind. Die Funktions- und Speicherzellen 0102, 0103 weisen Eingange auf, die 
mit dem Bussystem oberhalb der Reihe, in der sich die jeweiligen Zellelemente 

30 verbindbar sind, um Daten davon zu empfangen. Weiter weisen die Zellen 0102, 
0103 Ausgange auf, die auf das Bussystem 0105 unterhalb der Reihe Daten 
ausgeben. Wie noch erlautert werden wird, ist Oberdies jede Speicherzelle 
0103 mit einem Ruckwartsregister (BW) versehen, durch welches Daten von dem 
Bus unterhalb einer Reihe auf den Bus oberhalb der jeweiligen Reihe 

35 durchgeschleust werden kOnnen. 

Mit Ausnahme der Steuerverbindungen 0104 und der zugeordneten Schaltungen 
innerhalb der Funktionszellen (ALU in Fig. 2) bzw. Speicherzellen (RAM in 
Fig. 2) handelt es sich bei dem Zellelementef eld zur Datenverarbeitung von 

40 Fig. 1 um ein herkcmmliches Zellelementef eld, wie es bei rekonfigurierbaren 
Datenverarbeitunsanordnungen, beispielsweise einer VPU entsprechend der XPP- 
Technologie des Anmelders gebrauchlich und bekannt ist. Insbesondere kann das 
Zellelementef eld von Fig. 1 wie bekannt betrieben werden, weist also 
entsprechende Beschaltungen zur Wave-Rekonfiguration, zum Debugging, 

45 tfbertragen von Triggersignalen etc. auf. 
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Die Besonderheiten des Zellelementefeldes der vorliegenden Erf indung ergeben 
sich aus der Steuerverbindung 0104 und der zugehdrigen Beschaltung, die 
nachfolgend n&her beschrieben werden wird mit Bezug auf die Fig. 2a-c. Es sei 
dabei erwahnt, da£, wahrend in Fig. 1 eine Steuerverbindung 0104 stets von 
5 einem weiter links liegende Funktionszellenelement zu einer weiter rechts 
liegenden Speicherzelle gefQhrt ist, und zwar nur und genau zu einer eolchen 
Speicherzelle, es einleuchtenderweise m&glich ist, auch fur die 
Steuerleitungen eine konf igurierbare Vernetzung vorzusehen, um entweder an 
anderer S telle liegende Speicherzellen anzusprechen und/oder um ggf . mehr als 

10 eine Speicherzelle ansprechen zu konnen, wenn etwa in groSem Umfange 

Speicherbedarf fur Informationen besteht, die von den Speicherzellen zu 
empfangen, abzuspeichern und/oder auszugeben ist. Aus Grunden der 
tfbersichtlichkeit wird aber in Fig. 1 und 2 lediglicb auf fest vorgesehene 
einzelne Steuerverbindungen Bezug genommen, was das Verstandnis der Erfindung 

15 wesentlich erleichtert. Die Steuerverbindung ist im ubrigen 

erforderlichenfalls durch herkcmmliche Leitungen, entsprechende Protokolle 
vorausgesetz t , substi tuierbar . 

In Fig. 2 ist die Funktionszelle 0102 als ALU und die Funktionszelle 0103 als 
20 RAM bezeichnet. Oberhalb der Reihe, in der die Zellen liegen, verlauft der 

Bub 0105a, der das bereits erwahnte Backward-Register 0103a mit den Eingangen 
0103b der Speicherzelle und 0102b der ALU verbindet. Das unterhalb der Reihe 
verlaufende Bus system ist mit 0105b bezeichnet und es sind von dem Bus system 
0105a, 0105b nur die relevanten Segmente gezeicbnet. Es ist erkennbar, daS 
25 das Bus system 0105b altemativ Daten erhalt aus einem Ausgang 0102c der ALU 
0102, einem Ausgang 0103c des RAM 0103 und dafi es Daten in den Bingang 0103al 
des Backward-Registers fuhrt. 



Die ALU 0102 weist zugleich weitere Ein- und Ausgange 0102al, 0102a2 auf, die 
30 auf andere Bus segmente geschaltet sein kttnnen und uber welche die ALU Daten 
wie Operanden empfangt bzw. Ergebnisse ausgibt. 

Die Steuerverbindung 0104 befindet sich dauerhaft unter der Kontrolle der 
erwe iter ten Schaltkreise der ALU und stellt hier eine Verbindung dar, Uber 

35 welche eine Vielzahl von Bits ubertragen werden kann. Die Breite der 
Steuerverbindung 0104 ist dabei so gewahlt, daS zumindest die zuvor 
beschreibenen Steuerbefehle an die Speicherzelle und die Forward/Backward- 
Register (FREO/BREG) ubertragen werden kOnnen. Die Speicherzelle 0103 weist 
zugleich bevorzugt drei Speicherbereiche auf, namlich einen sog. Stack- 

40 Bereich, einen Heap-Bereich und einen Programm-Bereicn. Jedem Bereich ist 
dabei ein eigener Zeiger zugeordnet, uber den bestimmt ist, auf welchen 
Bereich des Stacks, des Heaps und des Programmbereiches jeweils lesend Oder 
schreibend zugegriffen wird. 

45 Der Bus 0105a wird im Zeitmultiplex gemeinsam von den Einheiten 0102 und 0103 
verwendet. Dies ist in den Fig. 2b, 2c angedeutet. So ist in Fig. 2b eine 
Situation gezeigt, in welcher aus dem Ausgang 0102a2 der ALU-PAE Daten uber 
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das Backward-Register auf den Eingang der RAM-Zelle gesandt werden kttnnen, 
wohingegen der zeitgleich bestehenden, wenngleich nicht benutzten Verbindung 
z wis chen dem Ausgang 0103c des RAM zum Bus 0105b und der Verbindung zwischen 
dem Ausgang des Backward-Registers BW zum Eingang 0102b der ALU-PAE zum 
5 Zeitpunkt von Fig. 2b keine Bedeutung zukoramt, wesbalb diese gestrichelt 
angedeutet sind. In Fig. 2c ist hingegen ein Zeitpunkt gezeigt, zu welchem 
die Speicherzelle 0103 fiber ihren Ausgang 0103c aus dem fiber Steuerleitung 
0104 bestimmten Speicherbereich Stack (0203), Heap (0202), Program (0201) die 
Information tiber das Backward-Register an den Eingang 2b der ALU-PAE 0102 
10 speist, wahrend der Ausgang der ALU-PAE 0102c inaktiv ist und am Eingang 
0103b der RAM-PAE kein Signal empfangen wird. Aus dies em Grund sind die 
entsprechenden Verbindungen strichpunktiert und somit als inaktiv 
dargestellt. 

15 Innerhalb der RAM-Zelle 0103 ist eine Schaltung 0103d vorgesehen, in der die 
tiber die Steuerleitung 0104 bzw. das Steuerleitungsbus segment 0104 empfangene 
Information decodiert wird. 

Die AusfUhrungsvariante der Erfindung wird verwendet vie folgt: 

20 

Zunachst empfangt die ALU 0102 Konfigurat ions information von einer zentralen 
Ladelogik, wie im Stand der Technik bereits bekannt. Die 

Informationsfibertragung kann in per se bekannter Weise unter Verwendung des 
RDY/ACK-Protokolls und dergleichen geschehen. Auf die MSglichkeit, bei der 
25 Ladelogik elnen FILMO-Speicher usw. vorzusehen, urn eine ordnungsgemafie 
Konfiguration der Anordnung zu ermCglichen, wird hingewiesen. 

Mit den Da ten fur die Konfiguration der ALU 0102 wird zugleich eine Reihe von 
Da ten aus der Ladelogik fiber tragen, die ein sequenzerartig abzuarbeitendes 

30 Programm darstellt. Dieses Programm kann entweder bereits das zur Berechnung 
bzw. Ausftthrung der Applikation auszuftihrende Programm sein, Oder einen Ov 
Urlader (Boot) darstellen, der erst das auszuftihrende Applikationsprogramm 
von einer externen Einheit (Speicher, Peripherie) ladt. Das Laden des 
Programmes kann entf alien, wenn ein Teil des der ALU zugeordneten Speichers 

35 nichtflfichtig (z. B. ROM, EPROM, EEPROM, Flash-ROM) ausgestaltet ist und ein 
Urlader oder das Applikationsprogramm dort fest gespeichert ist. Dies kann 
insbesondere dann von Vorteil sein, wenn die Applikation vorab bekannt ist 
und unabanderlich gestaltet werden kann, da eine feste Implementierung dann 
zu einer erheblichen Kostenreduktion ftihren kann. Die ALU gibt deshalb 

40 wahrend ihrer Konfiguration auf der Leitung 0104 einen entsprechenden Befehl 
aus, der den Programmzeiger zum Schreiben auf einen vorgegebenen Wert 
innerhalb des RAM setzt. Danach werden von der Ladelogik bei der ALU 
empfangene Daten fiber den Ausgang 0102c fiber den Bus 0105bl und das Backward- 
Register 0103a gespeist und gelangen von dort in den Eingang 0103b der RAM- 

45 PAE 0103. Von der Einheit 0103d werden entsprechend des Steuerbefehls auf 
Steuerleitung 0104 dann Daten auf den angewiesenen Programmspeicherplatz 
geschrieben. Dies wiederholt sich, bis samtliche, von der Ladelogik bei der 
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Konfiguration empf angenen Programmteile in der Speicherzelle 0103 abgelegt 
sind. Wenn dann die Konfiguration der ALU beendet ist, wird diese durch 
Ausgabe der entsprechenden Befehle auf der Steuerleitung 0104 die nachsten, 
von ihr sequenzerartig abzuarbei tenden Programmschritte anfordem tind tiber 
5 den Ausgang 0103c, den Bus 0105b, das Backward-Register der RAM-PAE 0103 und 
den Bus 0105a an ihrem Eingang empfangen. Wahrend der Programmabarbeitung 
kSnnen dabei Situationen auftreten, bei denen SprUnge innerbalb des 
Programmspeicherbereiches erforderlich sind. Da ten in die ALU-PAE aus der 
RAM-PAE geladen werden, Daten im Stack abgelegt werden mttssen usw. Die 

10 diesbezttgliche Kommunikation zwischen ALU-PAE und RAM-PAE erfolgt tiber die 
Steuerleitung 0104, so da£ die ALU-PAE zu jedem Zeitpunkt die Dekodierung 
durchftihren kann. Oberdies k6nnen auch, wie bei einem herkoiranlichen 
Mikroprozessor, Daten aus einem Stack oder einem anderen RAM-Speicherbereich 
empfangen werden und es kOnnen tlberdies Daten von aufierhalb als Operanden in 

15 der ALU-PAE empfangen werden. 

Es findet dabei die Abarbeitung der Programmsequenz statt, die in den RAM-PAE 
durch die Ladelogik vorkonf iguriert wurde. In der ALU-PAE wird dabei 
zugleich, wie per se erforderlich, eine Befehlsdekodierung vorgenommen. Dies 
20 geschieht mit den per se gleichen Schaltkreisen, die schon fur die 

Dekodierung der von der Ladelogik erhaltenen Befehle verwendet werden. 

Es wird tiber die ALU zu jedem Zeitpunkt die Steuerleitung 0104 kontrolliert, 
so dafi die RAM-Zelle stets genau die Art des Speicherzugrif fes befolgt, die 
25 von der ALU vorgegeben ist. Auf diese Weise ist sichergestellt, daE 

ungeachtet der Zeitmultiplex-Benutzung der Buselemente 0105a, b jederzeit den 
in der Sequenzerstruktur vorhandenen Elementen vorgegeben ist, ob auf den 
Bussen Adressen fttr zu holende und/ oder zu schreibende Daten oder Codes 
liegen oder ob und gegebenenfalls wohin Daten zu schreiben sind etc. 

30 

Die in Bezug auf Fig. 2 gezeigte Anordnung kann auf unterschiedliche Arten 
erweitert oder verandert werden. Besonders relevant sind die in Fig. 3a und 
3b dargestellten Varianten. 

35 Nach Fig, 3a ist zur Verbindung von oberen und unteren Bussen. nicht nur ein 
Backward-Register an der RAM-PAE vorgesehen, sondern es sind auch ein 
Vorwarts -Register an der RAM-PAE und Vorwarte- und RUckwarts -Register an der 
ALU-PAE vorhanden. Diese konnen, wie durch die Mehrfach-Pfeile angedeutet, 
dazu dienen, von anderen Einheiten, wie externen Hosts, externen Peripherie- 

40 Geraten wie Festplatten, Hauptspeicher und dergleichen und/ oder von anderen 
Sequenzers trukturen , PAEs, RAM-PAEs etc. Daten zu empfangen und an diese zu 
senden. Wenn ein entsprechender Anforderungsbef ehl fur neue Programmteile aus 
der Sequenzerstruktur, die durch die ALU-PAE und die RAM-PAE gebildet ist, 
abgesandt wird, ist es moglich, Progr ammbl ocke in der Sequenzerstruktur 

45 abzuarbeiten, die weit grtfSer sind als jene, die in der RAM-PAE speicherbar 
sind. Dies ist insbesondere bei komplexen Datenverarbeitungsaufgaben, 
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Sprttngen ttber weite Bereiche, insbesondere in Unterprogramme usw. von 
massivem Vorteil. 

Eine noch weiter bevorzugte Variante ist in Fig. 3b gezeigt. Hier 
5 koanmuniziert die ALU -PAE nicht nur mit einer RAM-PAE, sondem zugleich mit 
einer Input/Output-PAE, die dazu ausgebildet ist, eine 

Schnittstellenbeschaltung far die Kommunikation mit extern en Bauelementen 
vorzusehen, wie Festplatten, anderen XPP-VPUs , fremden Prozessoren und 
Coprozessoren usw. Wiederum ist die ALU- PAE die Einheit, die als Master fur 
10 die als # CMD* bezeichnete Steuerverbindung arbeitet und wiederum werden die 
Busse in Multiplex-Weise verwendet. Auch hier kann eine Obertragung von Daten 
von dera Bus unterhalb der Reihe in den Bus oberhalb der Reihe durch das 
Backward-Register erfolgen. 

15 Die in Pig. 3b gezeigte Anordnung erraoglicht es, externe Zugriffe auf nicht 
in der Speicherzelle RAM-PAE abspeicherbare Informations besonders leicht zu 
gestalten und ermOglicht damit eine Anpassung der Sequenzerstruktur an 
bestehende, herkc-mmliche CPU-Technologien und deren Betriebsverfahren in noch 
starker em MaBe insoweit, als nun in der Eingabe-Ausgabezelle 

20 Adressttbersetzungsmittel, Speicherverwaltungseinheiten (MMU-Funktionen) und 
dergleichen implement iert sein konnen. Die RAM-PAE kann hier etwa als Cache, 
insbesondere aber als vorgeladener Cache dienen. 

Es sei darauf hingewiesen, dafi mehrere Sequenzerstrukturen gleichzeitig in 
25 ein und dasselbe Feld hineinkonf iguriert werden konnen, dafi Funktionszellen, 
Speicherzellen und ggf . Ein-Ausgabezellen wahlweise fur Sequenzerstrukturen 
und/ Oder eine fur die XPP-Technologie herkCmmliche Weise konf iguriert werden 
kOnnen und dafi es ohne wei teres mOglich ist, dafi eine ALU an eine andere ALU 
Daten ausgibt, die diese in einer Sequenzer-Weise konf igurieren und/oder zum 
30 Teil eines Zellelmentefeldes machen, mit dem eine bestimmte Konfiguration 
abgearbeitet wird. Auf diese Weise wird dann gegebenenfalls auch die 
Ladelogik entbehrlich. 

Figur 4 zeigt nun noch einmal detailliert den Grundaufbau einer PAE. Der Kern 
35 einer PAE, typischerweise bestehend aus einer oder mehreren ALUs und/oder 
einem Speicher und/oder FPGA-Elementen erhaMt Daten von dem Bus system 0105a 
und ubertrSgt die Ergebnisse der Datenverarbeitung an das Bussystem 0105b. 
Neben dem Kern sind die Forward-Register (FREG, 0402) und Backward-Register 
(BREO, 0403) angeordnet und ubertragen Daten von 0105a nach 0105b (FREG) bzw. 
40 von 0105b nach 0105a (BREG) ,BREG und FREG konnen ebenfalls eine oder mehrere 
ALUs und/oder einem Speicher und/oder FPGA-Elementen en thai ten. Bevorzugt 
sind diese jedoch in ihrem Funktionsumfang gegentlber dem Kern (0401) 
eingeschrankt . 

Die Bussysteme 0105a und 0105b sind bevorzugt jeweils in ein Bussystem zur 
45 Obertragung von Daten (DATA) und ein Bussystem zur Obertragung von Trigger, 
also Statussignalen (TRIGGER) unterteilt. 
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Die Konf iguration der PAE erf olgt durch eine Obergeordnete 
Konfigurationseinheit (z. B. eine CT) , die Ober einen Konf igurationsbus 
(0404) Konfigurationsworte an die PAE ubertragt. Diese werden in 
Konf igurationsregistem gespeichert (0405) . Optional kann ein 
5 Konfigurationsstack (0406) nach PACT17 und wie nachfolgend beschrieben 

zwischen den Konfigurationsbus (0404) und die Konf igurationsregister (0405) 
zwischengeschaltet sein . 

Der Konfigurationsstack kann Da ten und/oder bevorzugt Trigger von den 
Bussystemen 0105 (a/b) empfangen und an diese senden. 

10 

Die PAE kann optional einen Anschlufi an ein dediziertes Bus system (10- 
Channelr 0407) aufweisen. Zur Steuerung des Bus systems ist dem Kern (0401) 
eine zusatzliche Bussteuereinheit (0408) zugeschaltet. Ober den IO-Channel 
kan die PAE direkt mit einem globalen, ggf . auch extemen Speicher und/oder 
15 Peripherie und/oder anderen PAEs Daten Obertragen. 

In einer bevorzugt en Ausgestaltung best eh t die MSglichkeit Konstanten fur die 
Datenverarbeitung Ober 0404 zu setzen. In einer weiteren Ausgestaltung kann 
eine Konfigurationseinheit (z. B. CT) Daten aus den Arbeitsregistern 
20 auslesen. 

Figur 4 kann auch eine entsprechende RAM- PAE darstellen. Ober 0404 kann dann 
von einer CT die Vernetzung und Funktion des RAMs eingestellt werden. 
Die Funktion umfafit beispielswiese folgende Funktionen oder Kombinationen 
25 daraus : 

1. Random Access 

2. FIFO 

3 . Stack 
30 4. Cache 

5. Page Memory fur MMDs 

Desweiteren kann in einer bevorzugten AusfUhrung der Speicher mit Daten von 
der CT vorgeladen werden (z. B. Konstanten, 
35 Lookup-Tabellen, etc.). Ebenfalls kann die CT in einer erweiterten AusfOhrung 
Daten (z. B. zum Debuggen oder fur Taskwechsel) aus dem Speicher Ober 0404 
zurtlcklesen. 

In einer bevorzugten AusfOhrung kann eine RAM-PAE mehrere AnschlOsse an das 
Bussystem 0105 aufweisen (dual -port oder multi-port) , wodurch mehrere 
40 Datentransfers gleichzeitig durchgefOhrt werden kOnnen. 

In einer weiteren AusfOhrung kann die RAM-PAE einen dedizierten Anschlufi an 
einen extemen Bus aufweisen. 

RAM-PAEs kOnnen der art zusanmengeschaltet werden, dass aus mehreren (n) RAM- 
PAEs ein n-fach grBfcerer Speicher entsteht. 

45 
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Figur 5 zeigt eine Ausgestaltungsvariante des Seguenzers nach Figur 3b. Die 
ALU- PAE weist einen minimal en Regis tersatz Ra, Rb, Rx auf, der in dies em 
Beispiel lediglich zur Pufferung der pperanden und Ergebnisse dient. Der 
eigentliche Registersatz liegt in der RAM- PAE (R0..Rn). Ebenfalls innerhalb 
5 der RAM- PAE liegen die Register 



Rpp; Programm Pointer 

Rap: Adress Pointer fur Datenzugrif fe (z.B. Heap) 

Rsp: Stack Pointer fur Stackzugrif f e 

Rfp: Frame Pointer zur Sicherung des Stack Pointers 

10 bei Unterprogrammaufrufen 



Der CMD-Bus wird von der ALU- PAE gesteuert und ubertragt die 
Abl auf in format ion des Seguenzers an samtliche beteiligten PAEs, sowie FREG 
und BREG zur Steuerung der DatenObertragung auf den Bussystemen (0105a, 
15 0105b) . 

Die RAM- PAE weist in diesem Ausgestaltungsbei spiel einen dedizierten IO- 
Cannel (0501) auf, Ober welchen sie ggf . auch selbststandig (z. B. uber DMA- 
Kontroller) Da ten von oder zu peripheren Einheiten (z.B, 10, Speicher) 
ubertragen kann. Es soil nochmals darauf hingewiesen warden, dass auch die 
20 ALU- PAEs einen solchen dedizierten Anschlufi aufweisen konnen oder in einer 
we iter en Ausgestaltungsvariante die ALU- PAE anstatt der RAM- PAE einen 
derartigen AnschluS besitzen konnte. 

Optional sind eine oder mehrere Datenaustauschvorrichtungen mit den 
restlichen Zellen des PAs (z. B. Funktions- und /oder Speicherzellen) 

25 implement! ert . Uber Eingabe-Ports (0502) kdnnen Da ten von dem PA gelesen 
werden und fiber Ausgabe-Ports (0503) ktfnnen die Daten ausgetauscht werden. 
Die Port werden beispiel sweise uber die CMD-Steuerkommandos reaoLjport und 
write_port angesteuert und schalten die Bussysteme entsprechend . Mit den 
Steuerkommandos wird ein Selektor ubertragen, der anzeigt welcher Port durch 

30 das Steuerkommando angesprochen 1st. 

Die vorl legend of f enbarte Lage der Register innerhalb der RAM- PAE ist 
ungewtthnlich, bietet aber zwei erhebliche Vorteile: 

a) Speicherzellen kttnnen fttr die Register verwendet werden. 

b) Die Pointer liegen direkt in der RAM- PAE, wodurch Datenzugrif fe auf den 
35 Speicher besonders schnell werden. Desweiteren ist fur samtliche Speicher- 

Zugriffe nur ein Bus auf dem Bussystem 0105 notwendig, wobei der 

normal erweise zusatzlich erforderliche Adressbus entfallt, da die Adressen 

lokal in der RAM- PAE durch die Pointer gegeben sind. 

Diese Anordnung wird daher als vom Anmelder bevorzugt typisch implementiert . 

40 

Fttr samtliche Daten transfers ist die Lage der Register zu beachten. Um 
lediglich moglichst einfache Befehle im Sequenzer zu implementieren, sind 
daher besondere Befehle zur Regis termanipulation vorgesehen: 
moveta Rrr: Ladt das Register Rrr (rr € {l..n, sp, pp, 
45 fp, ap)) nach Ra 

movetb Rrr: Ladt das Register Rrr nach Rb 
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movefx Rrr: Schreibt das Register Rx nach Rrr 

Um den Datenf luficharacter der ALU zu wahren, ist bevorzugt ein weiterer 
besonderer Opcode iraplementiert : 
5 feed: ubertragt Da ten von Ra/Rb nach Rx, ohne diese 

zu manipulieren. 

Nachfolgende Beispiele verdeutlichen die Arbeitsweise des Sequenzers: 
Addiere Register Rl zu Register R2 und schreibe Brgebnis nach Register R2 : 
10 moveta Rl; movetb R2; add; movefx R2; 

Schiebe Register R4 nach Register R7: 
moveta R4; feed; movefx R7; 

15 Obertrage R5 auf Stack: 

moveta R5; feed; push; 
Anmerkung: push ubertragt Da ten des Registers Rx an die Speichers telle auf 
die Rsp zeigt und dekrementiert (bzw. inkermentiert) Rsp. 

20 Setze Adresspointer Rap mit der indirekten Adresse R4 addiert zu R7: 
moveta R4; movetb R7; add; movefx Ra; 

Lade Daten aus Speichers telle Rap nach Rl: 
load; feed; movefx Rl; 
25 Anmerkung: load ubertragt Daten von der Speichers telle auf die Rap zeigt nach 
Ra. 

Die Datenregister werden bevorzugt innerhalb des Speichers der RAM-PAE 
angeordnet, z. B, von Adresse 0x0 bis 0x7 (fur n = 7) . Register werden 
30 beispielsweise angesprochen, indem beim Auftreten des entsprechenden CMD 

Steuerkommandos (z. B. reac^jceg, write_reg) die Regis temummer mi tuber tragen 
wird, diese als Adresse an den Speicher tiber tragen wird und die hoherwertigen 
Adressbits mit 0 gefullt werden. 

Die Startadresse fttr den Code ware dann beispielsweise 0x8 (also 0x(n+l)), 
• 35 worauf dann der Programmpointer Rpp nach einem Reset .zeigen wttrde. 

Die Adresszeiger werden bevorzugt nicht im Speicher abgelegt, sondem in 
gesondert implementierten Regis tern untergebracht, um eine schnelle und 
einfache Aufschaltung auf die Adressleitungen des Speichers zu ermdglichen. 

40 In Figur 5b ist eine Architekturvariante mit Regis tersatz innerhalb der ALU- 
PAE dargestellt. Die umstandlichen Registertransferoperationen entf alien 
damit, wodurch diese Variante auch erheblich schneller in der 
Datenverarbeitung ist. Aller dings ist sind die Hardwarekosten hOher, da der 
Regis tersatz zusatzlich implement iert werden muss und fur samtliche 

45 Speicherzugrif fe die Adressen von der ALU-PAE an die RAM-PAE ubertragen 
werden raflssen. 
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RAMoverPAE 

Die nachfolgend beschriebene besondere Ausgestaltung einer ALU-PAE (im 
Folgenden mit ROP-PAE bezeichnet) eignet sich besonders fur VPUs, deren 
Applikation irregulare sequentielle Codes aufweisen, die auf kleine 
5 Dateiunengen in einer weitgehend ungeordneten Reihenfolge zugreifen. 

Zur Realisierung dieser Aufgabe wird in eine ALU-PAE Speicher integriert 
(Integrated RAM = IRAM), auf den die ALU direkten Schreib/Lese-Zugrif f 
besitzt. Die ALU ist entsprechend um eine Adres s verwal tungs schal tung 
10 erweitert. Insbesondere kcnnen daher PAEs nach dem vorstehend beschriebenen 
Aufbau (IPAEs) verwendet werden, wobei der separate RRAM ggf . entf&llt und 
durch den integrierten IRAM ersetzt ist Oder der RRAM zusatzlich zum internen 
IRAM quasi als Speichererweiterung vorgesehen ist. 

15 In einer besonders bevorzugten Ausfuhrung ist ein Sequenzer bzw. 

Microcontroller mit einem bevorzugt limi tier ten aber bevorzugt vollstandigen 
Befehlssatz (vgl. ARC Microprocessor) in der ROP-PAE integriert, der die 
Verarbeitung sequentieller Codes ermoglicht. In einer weiteren 
Ausftthrungsvariante kann der Sequenzer in seiner Punktion und seinem 

20 Ablauf verbal ten auch konf igurierbar ausgestaltet sein (wie beispielsweise 

nach dem Stand der Technik bekannt, z.B. durch EPS448 von Altera [ALTERA Data 
Book 1993]). Der Sequenzer /Microcontroller kann auf Zustande (z.B. 
Status signale, Ereignisse) in der RDP-PAE und/oder auf Zustande (z. B. auch 
Trigger) anderer PAEs die mit der ROP-PAE verbunden sind (z.B. ttber ein 

25 Bussystem) reagieren. 

Der Sequenzer/ Microcontroller liest seine Programmbefehle aus dem IRAM. 
Die Zugriffe auf das Bussystem des Arrays (PA) entsprechen den ublichen PAEs, 
ebenso die Generierung, der Empfang und die Wei ter lei tung von Status signal en 
(Trigger nach PACT08) . Mehrere Busanbindungen fur Da ten- und Triggereingange 

30 und ftlr Da ten- und Triggerausgange k6nnen vorgesehen sein. 

Die ROP-PAE kann Operanden vom Bus lesen ggf . mehrzyklisch Verarbeiten und 
das Ergebnis wieder auf den Bus schreiben. 

In die ROP-PAE ist in einer bevorzugten Ausgestaltung ein Regis tersatz 
integriert. Der Registersatz kann in einer besonderen Ausgestaltung ahnlich 

35 des Registersatzes von Transputern als Stack organisiert. Dadurch kann der 
Registersatz besonders klein und hardwaretechnisch ef f izient realisiert 
werden (typischerweise reichen 3 Register A, B und C aus). Weiterhin ist aus 
der Transputer technologie bekannt/ dass Compiler eff izient mit einem 
derartigen hardwaretechnisch kostengttnstigen Registersatz arbeiten konnen. 

40 Ebenfalls kann der Registersatz optional im RRAM liegen. 

In einer bevorzugten AusfOhrung besitzt die ROP-PAB direkten AnschluS 
( EXTBUS ) an ein extemes RAM und/oder exteme 10. Es kOnnen 

applikationsabhangig mehrere EXTBUS vorgesehen sein. In einer dabei besonders 
45 bevorzugten Ausgestaltung kann der EXTBUS liber eine r ggf . dedizierte, 
Verbindung des PAE-Bussys terns an eine interface-Baugruppe (IOAG) wie 
beispielsweise aus DE 196 54 595.1-53 oder DE 102 06 653.1 bekannt 
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realisiert sein. Die Ansteuerung von Speicher (RAM) und/oder Peripherie (10) 
erfolgt dabei durch die Interface-Baugruppe. 

In einer bevorzugten Ausftihrung kann die ROP-PAE und dabei bevorzugt das I RAM 
5 direkt selbstandig Adreseen fur das exterae RAM und/oder die externe 10 
und/oder andere interne Speicher (RRAM/IRAM) generieren und externe oder 
interne Datentransfers selbstandig steuern. Diese Funktion kann durch 
eigenstandige im RRAM implementierte Adressgeneratoren realisiert werden. 
Beispielsweise eignen sich DMA-Kontroller besonders fur diese Aufgabe, indem 

10 sie blockweise Daten zwischen den Speichem kopieren. Der Adressraum der zu 
lesenden Daten und der Zieladressraum wird entsprechend gesetzt und der 
Kopiervorgang wird gestartet. Das Setzen kann durch die IPAE erfolgen. 
In einer hardwaremaSig aufwendigeren LBsung kann die Funktion durch eine 
implementierte MemoryManagemen tUni t (MMU) realisiert sein. Die Funktionsweise 

15 ist durch den Stand der Technik definiert und bekannt. ZusammengefaEt 
arbeitet eine MMD wie folgt: 

Der von der MMU verwaltete RRAM Speicher ist in inehrere Seiten (Pages) 
aufgeteilt. Jede Page en thai t Daten eines virtuellen Speicherraumes innerhalb 
eines extern en Speichers. Beispielsweise kdnnen die hexade z ima 1 en RRAM- 

20 Adressen OxOaOO. .OxOaff Daten des externen Speichers an den Adressen 

0xbdl3200. .0xbdl32ff en thai ten. Zur Verwaltung der Adressumsetzung wird eine 
Adresstibersetzungseinheit verwendet, die gewOhnlicherweise durch Lookup- 
Tabellen realisiert ist. Aufgabe einer MMD ist es insbesondere einen grofien 
Speicherraum auf einen sehr viel Kleineren (in diesem Fall der RRAM) zu 

25 tibersetzen. Dies geschieht derart, dass Seiten je nach Bedarf von dem grofien 
Speicherraum in den Kl einen kopiert werden. Sobald eine Seite nicht mehr 
bentttigt wird kann diese gelttscht und/oder tiberschrieben werden. Wenn die 
Daten auf der Seite verandert wurden, wird die Seite bevorzugt vor dem 
Ltfschen/tJberschreiben in den grofien Speicherraum zurttckgeschrieben. 

30 Die Adressumsetzungseinheit arbeitet derart, dass ein hdherwer tiger Teil der 
physikalischen Adresse (also die Adresse der Seite) in dem Iiookup-Speicner 
abgelegt wird und auf die entsprechenden Daten der Seite im RRAM zeigt, 
sobald die Seite innerhalb des kleinen Speichers (RRAM) verfUgbar ist. 
Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM ist 

35 auch keine Referenz eingetragen. In diesem Fall muss die Seite erst' von dem 
grofien (externen) Speicherraum in den RRAM kopiert werden. Hierzu kann eine 
andere bevorzugt aktuell nicht verwendete Seite gemafi dem vorstehenden Ablauf 
tiberschrieben werden. 

Das Kopieren kann dabei automatisiert, also ohne wesentliche Beteiligung 
40 durch den Sequenzer erfolgen, indem von der MMO ein DMA-Kontroller 

angesteuert wird. Diesem werden die entsprechenden S ei t enadr es s en im RRAM und 
externen RAM, sowie die SeitengrOfie durch die MMU zur Verftigung gestellt (z. 
B. in Register eingetragen) . 

45 Die ROP-PAE besitzt einen AnschluS an eine Konf xgurationseinheit die die ROP- 
PAE entsprechend des Oblichen Verf ahrens konfiguriert und rekonf iguriert. In 
einer bevorzugten Ausfuhrung kann die CT auf den IRAM lesend und/oder 
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schreibend zugreifen, urn Daten und/oder Code fur den Seguenzer im I RAM zu 
verwalten. 

In einer besonders bevorzugten AusgestaXtung kann die ROP-PAE selbstandig 
5 Code fttr den Sequenzer tlber das PA Bus system und/oder den EXTBUS aus dem 
externen RAM laden. 

In einer bevorzugten Ausfuhrung ist der I RAM in mehrere Segmente unterteilt, 
die in unterschiedlichen Adressbereichen liegen. Die Segmente k6nnen 
10 beispielsweise ftir einige der folgenden Funktionen aufgeteilt sein: 

Seguenzer speicher, Stack (z.B. fur Regis tersatz) , Datenspeicher, Heap, 10- 
Puffer, Puffer zu externem RAM bzw. Cache, Ijookuptabellen, Konfigurationen 
fur PAEs und/oder Busse, der Registersatz der ROP-PAE. 

Je nach Funktion ktfnnen dazu folgende Ansteuermechanismen vorgeseben sein: 
15 Seguenzer- /Code- Speicher: Programmzeiger auf die entsprechenden 
Speicherstellen (Rpp) . 

Stack: Stackzeiger auf die oberste Speicher s telle des Stack (Rsp) , 
gegebenenfalls auch ein FramePointer (Rfp) , wie er nach dem Stand der Technik 
(z.B. Intel Pentium) bekannt ist. 
20 Konfigurationen fttr PAEs und/oder Busse: Hierrauf kann ein Zeiger innerhalb 
der CT und/oder - implementierungsabhangig ein Zeiger innerhalb der 
Konfigurationssteuerung der PAE zeigen. 

Registersatz der IPAE: Sollte der Registersatz der PAE im Speicher 
untergebracht sein, wir dieser direkt durch die PAE mit bevorzugt 

25 hardwaretechnisch fest vorgegebenen adressiert. 

Die res tli chen Spei cherberei che , wie Datenspeicher, Puffer, Tabellen werden 
typischerweise durch den Compiler oder Programmierer aufgebaut. Die 
Adressierung dieser Bereich erfolgt durch das auszufunrende Programm und/oder 
Be triebs systems und wird innerhalb der Programmes und/oder Betriebssystems, 

30 ggf . unter Zuhilfenahme der Regis t ersatzes und der ALU des Sequenzers, 
berechnet . 

In einer mfiglichen Variante ist der IRAM komplett oder teilweise, wie bei den 
IPAEs beschrieben, durch RAM- PAEs aufierhalb der ROP-PAE realisiert. Fur ggf. 
unterschiedliche Segmente konnen unterschiedliche RAM- PAEs verwendet werden. 

35 

In einer bevorzugten Ausgestaltung kOnnen einige oder alle Segmente als 
aktive Speicher ausgestaltet sein, also eine DMA und/oder MMU besitzen und 
somit selbstandig Daten in oder aus den ihrem Speicher von oder nach anderen 
Speichem oder Peripheriegeraten kopieren. Insbesondere kBnnen sie die 
40 Funktionen der Speicher aus der DE 199 26 538.0 aufweisen, z. B. FIFO, 
Stack, Random Access, Cache, etc., wobei fttr jedes Segment einzeln die 
Funktion konfigurierbar und/oder durch den Sequenzer pr ogrammi erbar ist.. 

In einer Ausfuhrung kann der IRAM als Multi-Port Speicher ausgefuhrt sein. 
45 Dieser kann den ggf. auch gleichzeitigen Schreib- und/oder Lese-Zugriff durch 
mehrere Speicherzugriff seinheiten auf den speicher inhalt ermBglichen . 
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Speicherzugrif f seinheiten kennen beispielsweise externe und/oder interne 
Peripherie, Prozessoren, andere PABs sein. 

In einer besonderen Ausfuhrung kann die ROP-PAE als lokale und ggf . auch 
5 globale Konf igurationseinheit ahnlich einer CT fur ROP-PAEs in der ttagebung 
arbeiten oder unter anderem diese Funktion mit erftillen. Bevorzugt arbeitet 
die ROP-PAE nach dem aus der DE 196 54 846.2-53 bekannten Verfahren bei der 
Verwendung als lokal Konf igurationseinheit. Wird die ROP-PAE als globale 
Konf igurationseinheit verwendet, Oder hat sie sehr viele lokale PAEs zu 
10 konfigurieren, wird bevorzugt das Verfahren nach der DE 196 54 593.5-53 

verwendet, das eine FILMO-Funktionalitat aufweist und daher sehr viele auch 
unabhangige Konf igurationen verwalten kann. Die ROP-PAE adressiert gesteuert 
durch den Seguenzer/Microcon troll er Konf igurationen im IRAM und konfiguriert 
diese an PAEs und/oder sich selbst und/oder bestimmt den Ablauf des 
15 Sequenzers /Microcontrollers. Bevorzugt findet hierbei eine Synchronisation 
mit einer Obergeordneten Konf igurationseinheit (z. B. CT oder andere PAEs) 
ahnlich der bekannten Inter-CT-Protokolle (DE 198 07 872.2, DE 100 28 397.7 , 
DE 199 26 538.0 ) statt. Die ROP-PAE kann Konf igurationen tiber eines der 
EXTRAM- Interfaces selbst laden und/oder Konf igurationen von einer 
20 ttbergeordneten Konf igurationseinheit tiber das CT Interface anfordern. Die 
Punktionsweise kann ahnlich der Rekonfigurationseinheit in der DE 196 54 
846.2-53 sein. 

Zusammengefafit ist der prinzipielle Arbeitsweise einer ROP-PAE ahnlich eines 
Microcontrollersystemes, dessen Busanbindung und/oder dessen Da ten transfers 
und/oder dessen Programmablauf einem VPU- System entspricht. Mit anderen 
Worten handelt es sich urn eine Multiprozessoranordnung, deren Bus system auf 
dem Prinzip der VPU-Architektur beruht. Die einzelnen Prozessoren werden von 
bevorzugt von einer Obergeordneten Steuereinheit (CT) verwaltet. Die 
DatenUbertragung ist selbstsynchronisierend tiber die RDY/ACK Protokolle der 
Bussys teste. Als ein besonders wesentlicher Aspekt wird der gemeinsame 
Prozessorstatus angesehen, der tiber das Triggerbus system repr&sentiert wird 
und den Status einer Mange von Prozessoren reprasentiert, der unter den 
Prozessoren zur Ablauf steuerung ausgetauscht werden mufi. Hierzu wird 
verwiesen auf DE 197 04 728.9, DE 101 39 170.6 und DE 101 29 237.6-53. 

fibenfalls wird Schutz beansprucht fur ROP-PAEs, die zusatzlich zu ihrem 
Anschluss an die intemen Bussysteme des Arrays aus PAEs einen dedizierten 
Anschluss (IO-Channel) an ein Oberregionales Bus system aufweisen, das 
insbesondere Da ten Uber lange Strecken inner halb des Arrays Obertragt 
und/oder insbesondere einen direkten AnschluS an die Peripherie aufweist. Der 
AnschluS an die Peripherie kann dabei direkt erfolgen, indem z. B. das 
Bus system bereits dem peripheren Protokoll entspricht oder tiber entsprechende 
Protokollwandler zur Umsetzung des Protokolls erfolgen. Das dedizierte 
Bus system kann dabei bereits einem Industriestandard entsprechen, z. B. PCI, 
RapidIO, Pirewire, USB, Ethernet, RAMBUS, DDR- RAM, etc. urn somit einen 
einfachen und unaufwendigen Anschluss der peripheren Gerate zu ermoglichen. 
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Gegebenenfalls k8nnen auch in zwischengeschalteten IOAGs (vgl. DE 196 54 
595.1-53 ) Protokollkonvertierungen derart durchgeftthrt werden, dass ein 
internes vereinfachtes und ggf . proprietares Busprotokoll auf ein oder 
mehrere komplexere externe Standardprotokolle tibersetzt werden. 
5 Es soli besonders darauf hingewiesen werden, dass unter Peripherie auch 

Speicher verstanden werden, wie bei den bereits aufgezahlten Busprotokollen 
verdeutlicht wird. 

Ebenfalls ist erf indungsgemafi besonders relevant, dass PAEs auch mehrere 
Anschltisse an dedizierte Bussysteme aufweisen konnen. 
10 Desweiteren eind anwendungsabhangig auch Architekturen sinnvoll, bei denen 
nur eine Teilmenge der PAEs Anschltisse an ein dediziertes Bussystem aufweist, 
oder unterschiedliche PAEs mit einer unterschiedlichen Anzahl von Anschltissen 
an ggf. auch unterschiedliche dedizierte Bussysteme aufweisen. 

15 Die beschriebene Struktur kann durch erweiterte und verbesserte 

Halbleiterherstellungsverfahren und -strukfcuren besonders leistungsfahig 
implementiert werden, indem der Speicher auf dem physikalischen Chip raumlich 
tiber oder unter den logischen Funktionen (ALU, Steuerung, Busse, etc.) der 
PAE angeordnet wird. Hi er ftir wird Schutz beansprucht. 

20 Dazu wird tiber der nach dem Stand der Technik bekannten ersten 
Halbleiterstruktur (z. B. Silizium) und der damit aufgebauten 
Transistorstrukturen eine oder mehrere we iter e Ebenen von 

Halbleiterstrukturen (Transistorstrukturen) aufgebracht, die ftir zus&tzliche 
Funktionen genutzt werden kOnnen. Beispielsweise konnen in einer ersten Ebene 
25 die Logik und Gatter der PAE-Funktion und in einer weiteren zusatzlichen 
Ebene die Speicher funktionen implementiert werden. 

In einer bevorzugten Bauweise werden die einzelnen Halbleiterschichten durch 
eine Isolierschicht voneinander getrennt. Die Isolierschicht kann 
Durchkontaktierungen (Vias) aufweisen, urn Signals zwischen den einzelnen 
30 Halbleiterschichten zu ttbertragen. 

Die Verdr ah tungs struktur kann je nach Anwendung unterschiedlich implementiert 
sein. Beispielsweise konnen direkt tiber jeder Halblei ter schich t 
Verdrahtungsebenen und/ oder eine global e Verdr ah tungsebene, die alien 
Halbleiterschichten zugeordnet ist vorgesehen sein. 

35 

Ura eine wirtschaf tliche Ausbeute zu erlangen, muss sichergestellt sein, dass 
die Oesamtschaltung, also alle Halbleiterstrukturebenen zusammen, eine 
hinreichend hohe Ausbeute erreichen. Desweiteren ist zu beachten, dass der 
Stromverbrauch, also die Verlustleistung/ aller Halbleiterstrukturebenen 
40 zusammen inner halb eines akzeptablen Bereiches bleibt, der zu keiner 
tJberhitzung und dem damit verbundenen Ausfall der Schaltung ftihrt. 
Es kann durch eine geeignete Zusammenstellung der Funktionseinheiten der 
einzelnen Halbleiterebenen den entsprechenden Anf orderungen entsprochen 
werden. 

45 Beispielsweise ist ftir die vorgeschlagene Architektur eine Ebene von 
Logikhalbleiterstrukturen und eine we it ere Ebene von 

Speicherhalbleiterstrukturen vorzusehen, die ftir diese Anf orderungen geeignet 
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sind. WShrend die irregular en und wenig redundanten Logikhalbleiter struktur en 
eine vergleichsweise hohe Pehlerquote mit hoher Verlustlei stung aufweisen, 
ktfnnen Speicherhalbleiterstrukturen vergleichsweise redundant mit niederer 
Fehler quote und durch geeignete Speicherverfahren (2. B. DRAM) auch mit 
5 geringer Verluetleistung implementiert werden. Es wird explizit darauf 

hingewiesen, daJS es moglich ist, Felder vorzusehen, bei welchen nicht alle 
Speicherplatze und/oder alle Logikhalbleiter strukturen voll funktional sind; 
es ist lediglich erforderlich, Mindestanf orderungen sicherzustellen und/oder 
eine ordnungsgemafie Verwaltung. Redundanzen sind bevorzugt fur beide 
10 Strukturen separat zu betrachten. 

Die Aufbringung der mehrfach unereinander liegenden Halbleister strukturen 
kann nach unterschiedlichen Verfahren erfolgen. Neben dem bereits 
beschriebenen Verfahren des Aufbringens einer weiteren Halbleiterebene fiber 

15 einer Isolierschicht, was z. B. durch Aufdampf en und/oder Aufkri stall is ieren 
erfolgen kann, sind auch thermische Oder mechanische Verbindungen mSglich, 
indem z. B. die auf zubringende Siliziumstruktur aufgelotet- oder aufgeklebt 
wird. Zum Auf lo ten eigenen sich beispielsweise auch Verfahren, die aus den 
Technologien zum Verbinden von Hal bleiter chips mit Gehausen bekannt sind. 

20 Dabei handelt es sich beispielsweise um Ref low-L8tung oder Thermokompression. 
Prinzipiell sind auch die einfache mechanische Verbindungsmethoden mtfglich, 
wobei sodann die Verdrahtung beispielsweise per Wirebond erfolgen kann. 
Voraussetzung hi erf Or ist, dass die Siliziumstruktur en unterschiedliche 
GrCSen aufweisen, sodass die Drahte von einer Siliziumstrukturoberflache zur 

25 nachsten gedrahtet werden kttnnen und, dass die Anzahl der Verbindungen 
vergleichsweise gering ist, damit diese mitt els Wirebond noch realisiert 
werden kdnnen. 

Zur Optimierung der Ausbeute kann insbesondere das Redundanz verfahren nach DE 

30 197 57 200.6-33 angewendet werden, Es soli erwahnt sein, dass das Verfahren 
nach DE 197 57 200.6-33 fur alle PAEs vorgesehen werden kann, also z. B. fur 
ALU- PAEs genauso wie fttr RAM- PAEs, Mit anderen Worten kOnnen fttr samtliche 
PAEs das in DE 197 57 200.6-33 beschriebene Redundanzverfahren angewendet 
werden. Auch die dortigen Textverfahren sind implement! erbar . 

35 Fur PAEs mit hauptsachtlich feingranularen Strukturen, also z. B. Speicher 

(RAM- PAEs) Oder FPGAs ist es von Vorteil, diese feingranularen Strukturen mit 
einer entsprechend feingranularen Redundanz zu versehen, d. h. nicht oder 
nicht nur die RAM-PAE oder eine eine FPGA-Struktur aufweisende PAE mit einer 
redundanten PAE zu versehen, sondem die f eingranulare Struktur selbst mit 

40 Redundanz zu versehen. Das heisst, dass beispielseise den Speicherzellen 
(bzw. FPGA-Zellen) redundante Speicherzellen (bzw. FPGA-Zellen) zugeordnet 
werden. Die Verbindungen (Leitungen, Busse, etc.) zwischen den jeweiligen 
Zellen sind dann entsprechend an die Erfordemisse einer redundanten Struktur 
angepafit. Der Aufbau redundanter Strukturen fur f eingranulare Zellen, wie z. 

45 B. Speicher oder FPGAs ist durch den Stand der Technik bereits bekannt. Fttr 
das Verstandnis von Ausgestaltungsdetails wird auf diesen verwiesen. 
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Die Verlustleistung l&fct sich nach den Verfahren von DE 196 51 075,9-53 und 
DE 101 35 210.7-53 erheblich minimieren , wodurch sehr hohe 
Integrationsdichten ermCglicht werden. 

5 Es soil darauf hingewiesen werden, dass die Anzahl der tibereinanderliegenden 
Halbleitersturkturen keineswegs auf zwei begrenzt 1st. Mit for tschrei tender 
technischer Entwicklung und Optimierung ist eine steigende, auch sehr groSe 
Zahl von tibereinanderliegenden Ebenen realisierbar . 

10 Die Ebenenaufteilung rauS dabei, weder bei einer zweilagigen, noch bei einer 
mehrlagigen Struktur auf eine ALU- Speicher-auf tei lung limitiert sein. Bereits 
bei zweilagigen Struktur en kann es sinnvoll sein den Speicher zusammen mit 
den ALUs in eine Lage zu legen und die andere Lage komplett fur die 
Bussysteme Oder die Bussysteme und IO-Ansteuerungen (IOAGs) zu verwenden . Die 

15 Bussysteme konnen dabei ttber die einfache Verdrahtung hinaus bevorzugt auch 
die Schaltel entente (Multiplexer, Transmission-Gates, etc.) und/oder 
Verstarkerelemente (Treiber, etc.) und/oder Synchronisationselemente 
(RDY/ACK-Steuerung) , die jeweils Halbleiter struktur en zu deren Realisierung 
benOtigen en thai ten. 

20 Desweiteren kann es sinnvoll sein, eine Ebene fur die Konf igurationsspeicher 
und/oder Konf igurationsregister und/oder CT und deren Speicher vorzusehen. 

Figur 6 zeigt eine Implementierung einer ROP-PAE . Architektonisch wurde die 
RAM-PAE innerhalb der ALU-PAE implementiert . Der gesamte Regis tersatz 

25 (R0..Rn, Rpp, Rsp, Rfp, Rap) ist in der ROP-PAE. untergebracht . Zugriffe auf 
die Register durch die ALU sind schnell und mit geringem Auf wand moglich. 
Adressen und Daten kdnnen direkt von der ALU an den Speicher ttber tragen 
werden, ohne ein Bussystem aufierhalb der ROP-PAE wie z. B. 0105 zu ben6tigen. 
Bevorzugt weist eine ROP-PAE einen oder mehrere dedizierte IO-Channel zur 

30 DatenUbertragung mit der Peripherie auf (beispielsweise 0601, 0602) . 

Datenverbindungen zu den restlichen PAEs kdnnen wie bereits bekannt durch 
FREG und/oder BREG realisiert werden. Hier angedeutet durch den Leseport 0603 
und Schreibport 0604. 

Bevorzugt sind ROP-PAEs bereits intern als Sequenzer ausgebildet und weisen 
35 damit bereits eine interne Rttckkopplung des ALU-Ausgangs auf die Register 
auf. Optional kann dies auch durch die Verwendung eines ROP-PAE externen 
Busses (z.B. 0105) und einer Rttckkopplung durch ein BREG, wie bereits bekannt 
erfolgen (0605) . 

40 Figur 7 zeigt verschiedene Aufbauvarianten von Halbleiterstapeln: 

Figur 7a zeigt einen einfachen Aufbau mittels Wirebond Verbindungen zur 
Datenttbertragung (0701), bei welchen zwei Dice (0702, 0703), also zwei Chips, 
aufeinander montiert sind. Ein Chip besteht stark vereinfacht aus einer 
Halbleiterebene zur Realisierung von Transistoren (z. B. Sllizium, 0704), 

45 mehreren Metal 11 agen zur Realisierung von Verbindungsleitungen (z. B. 

Aluminium und/oder Kupfer; dargestellt sind 3 Lagen 0705a, b,c), die jeweils 
durch eine Isolierschicht untereinander und gegenttber 0704 elektrisch 



WO 03/036507 



PCT/EP02/10572 



getrennt sind, und eine obere, besonders wider stands fahi gen Isolierschicht 
0706. In die Isolierschichten sind Durchgangsleitungen aus Metall zur 
elektrischen Verbindung der einzelnen Ebenen, sogenannte Vias, eingeftlgt. 

5 In Figur 7b sind die be i den Dices mittels einer Art Flip-Chip-Technologie 
miteinander verbunden, wobei die Obertragung von Signal en durch sogenannte 
Bumps nach dem Stand der Technik erfolgt. Zusatzlich zu den durch die Flip- 
Chip-Technologie g eg ebenen Moglichkeiten des AnschluS von Bumps (0711) auf 
der jeweils obersten Metalllage soil hier die besondere erfindungsgemaSe 

10 Ausgestaltung gezeigt werden, die Bumps unterhalb der Halbleiterschicht (z.B. 
Silizium) zu kontaktieren. Dazu werden elektrische Verbindungen (z.B. 
Aluminium oder Kupfer) , also Vias (0712), durch die Siliziumschicht nach 
unten geftihrt. Die Durchftlhrung erfolgt bevorzugt durch Atzen von 
entsprechenden Lochem in die Halbleiterebene. Zwischen den Verbindungen und 

15 der Halbleiterschicht wird eine Isolierung eingeftlgt. 

Die DurchfOhrung kann wie bei Figur 7d angedeutet entweder direkt durch die 
Halbleiterschicht erfolgen oder es werden, wie bevorzugt, zunachst Wannen 
(0731) in die Halbleiterschicht geatzt, die mi t einer Isolierung gefullt 
werden und in welche dann die Vias eingebracht werden. 

20 

Figur 7c zeigt die besonders bevorzugte Variante zur Realisierung von 
Halbleiterstapeln. Oberhalb der obersten Isolierschicht (0721) einer ersten 
Halbleiterstruktur, die in diesem Fall dtinner ausf alien kann, wird eine 
weitere Halbleiterebene (0722) aufgebracht. Dazu wird die Isolierschicht 

25 (0722) zunachst durch Atzen und/oder Schleifen mttglichst eben gemacht. Das 
Aufbringen der Halbleiterschicht kann durch Aufdampfen, Auf Ziehen von 
Kris tall en oder bevorzugt durch Auf kl eben oder klebeahnl ichen Verbindungen 
aufgebracht. Wesentlich, v. a. bei der Verwendung von Verklebungen ist, dass 
durch die aufgebrachte Halbleiterstruktur und das Verbindungsmaterial (z.B. 

30 Klebematerial) durchgeatzt werden kann. Die Durchatzung ist erf orderlich, urn 
Kontakte, wie in Fig. 7b beschrieben zu den Vias in der darunterliegenden 
Isolierschicht zu fQhren. 

Die DurchfOhrung der Kontakte erfolgt gemaS Figur 7d z. B. durch das Einatzen 
schmaler Kanale, in die ein Isoliermaterial eingebracht wird. Danach wird in 
35 einem weiteren Schritt in das Isoliermatierial ein schmaleres Via eingeftlgt. 
indem z. B. zuvor in dem Isoliermaterial ein Loch entsprechenden Durchmessers 
z. B. durch Atzen erzeugt wurde. 

Das bevorzugte Verfahren sieht das Atzen gross erer Wannen (0731) vor, welche 
mit Isoliermaterial geftillt werden. In die Wannen werden dann ggf . mehrere 
40 Vias (0712) wie beschrieben eingeftlgt. 

Die Figuren 7e,f,g,h zeigen verschiedene bevorzugte funktionale Aufteilungen 
solcher Halbleiterstapel. Die Halbleiterebene ist jeweils schraffiert 
dargestellt und die Isolierschicht durch dicke Umrandung. Dazwischen liegen 
45 die Metalllage. Wie in Fig. 7g,h angedeutet ist die Konstruktion nicht auf 2 
Stapel beschrankt, ebenso sind grofiere Stapel, z.B. mit 3,4, oder mehr Ebenen 
mdglich. 
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Die mehrfache beschriebene Auftrennung zwischen Speicher und ALUs ist in Fig. 
7e dargestellt. 

Fig. 7f zeigt die Trennung der Bussysteme mit den notwendigen Schalteinheiten 
5 und der IO-Struktur von den ALUs und Speichem, die sich in diesem Beispiel 
in derselben Ebene befinden. 

In Fig. 7g liegen auf der untersten Ebene die ALUs. Auf oberster Ebene liegen 
die Speicher und ggf . die Treiber der 10. Somit sind die Strukturen mit hoher 
Verlustleistung an den aufieren Randern der Stapel untergebracht. Besonders 
10 hi erf Or wird Schutz beansprucht, da dadurch eine besonders optimale 

Warmeabfuhr roflglich ist. Die Bussysteme und deren Schalteinheiten sind in der 
mit tier en Ebene untergebracht. 

In dem Beispiel Fig. 7h sind in den mittleren Ebenen verlustleistungsarme 
Busse und Speicher untergebracht. ALUs und die besonders energieaufwendigen 
15 10 sind zur optimal en Warmeabfuhr in den Randern untergebracht. 

IOx-PAEs 

Aus DE 199 26 538.0 sind Speicher (lORAM-PAEs) mit einem dedizierten 

Anschluss an externe Einheiten wie z.B. Peripherie und/oder Speicher bekannt. 
20 Weiterhin sind aus DE 196 54 595.1-53 und DE 102 06 653.1 dedizierte 

Einheiten (z. B. Inter face-Baugruppen <IBG)) zum Anschluss von externen 

Einheiten wie z. B. Peripherie und/oder Speicher bekannt. 

Beide Verfahren weisen das Problem auf, dass ein zusatzlicher Auf wand zur 

Datenkommunikation zwischen PAEs, insbesondere datenverarbei tender und/oder 
25 datenberechnender PAEs und externen Einheiten betrieben warden muss, indem 

die Daten explizit zwischen den PAEs und den IBGs und/oder lORAM-PAEs 

tibertragen werden mtlssen. 

Es wird nunmehr erfindungsgemaS vorgeschlagen und wie bereits vorstehend 

30 mehrfach erwahnt fur beliebige PAEs, insbesondere jedoch fur 

datenverarbeitende und/oder datenberechnende PAEs (z. B. ALU- PAEs nach DE 196 
51 075.9-53 , IPAEs, HOP- PAEs) und datenspeichernde PAEs {RAM- PAEs nach DE 
100 50 442.6 ) einen oder mehrere dedizierten AnschlOsse (IO-Channel) an 
externe Einheiten wie z. B. Peripherie und/oder Speicher vorzusehen. Dadurch 

35 ist eine direkte Kommunikationsm5glichkeit der PAEs, die nachfolgend IOx-PAEs 
genannt werden, und externen Einheiten gegeben. Der Vorteil dieser 
Architektur liegt darin, dass die Verbindung des Arrays aus PAEs (PA) mit der 
Peripherie (externem Speicher und/oder IO-Einheiten) erheblich ef fizienter 
aufgebaut werden kann. Die best eh end en konfigurierbaren Bussysteme der PAEs 

40 untereinander (BUS) mtlssen nicht mit den 10-Datentransfers belastet werden. 
Desweiteren kann bei einer entsprechenden Ausgestaltung des IO-Channel die 
Adressierung der Daten fur oder einzelne PAEs sehr viel einf acher 
durchgeftthrt werden, als dies mittels des BUS moglich ware. 
Dies kann bevorzugt dadurch realisiert sein, dass jede an einen IO-Channel 

45 angeschlossene Einheit eine eigene eindeutige Adresse besitzt. Mittels dieser 
Adresse kann jede Einheit explizit und einf ach angesprochen werden, indem die 
Adresse ttber den IO-Channel tibertragen wird und jede Einheit diese Adresse 

30 
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mit ihrer eigenen vergleicht. Wenn die Adressen ubereinstimmen , ist die 
Einheit adressiert und die Daten sind fttr diese Einheit bestimmt. 
Bevorzugt kann jede Einheit nicht nur die Zieladresse, also die Adresse der 
Einheit ftir die die Daten bestimmt sind, sondern auch ihre eigene Adresse 
5 tibertragen, um eine Identif ikation des Senders zu erraoglichen. 

Besonders ef f izient kann das Vorsehen von IO-Channels fur nur eine Teilmenge 
aller PAEs sein. Beispielsweise bietet es sich an, nur Streifen von PAEs mit 
IO-Channel-Erweiterung innerhalb einer Anordnung von PAEs (PAE- Array, PA) 
10 vorzusehen. Dadurch wird eine verbesserte Flachen- und Kostenef f izienz 
gegenuber der Implementierung der IO-Channel-Erweiterung in alle PAEs 
erreicht . 

PAEs, die besonders hohe Kommunikationsanforderungen aufweisen, konnen 
15 applikationsabhangig auch an mehrere IO-Channel angeschlossen sein. 

Die dedizieren IO-Channels konnen dabei auf unterschiedlichen Bussystemen 
aufgebaut sein, z. B. insbesondere nach DE 197 04 742.4 Oder als paralleles 
Standardbussystem wie Rapid- 10, PCI, AMBA oder serielles Standardbus system 
20 wie 0SB, Firewire, Ethernet. 

Besonders leistungsfahig kann die Implementierung von IO-Channels in PAEs 
dann sein, wenn diese nicht direkt an die extemen Einheiten gefuhrt sind, 
sondem zunachst an eine IO-Verwaltungseinheit {IOAG) , die ahnlich dem 

25 Protokollkonverter nach DE 102 06 653.1 oder der IOAG nach DE 196 54 595.1- 
53 aufgebaut sein kann. Der Vorzug liegt darin, dass ein einf aches internes 
Busprotokoll zur Steuerung der IO-Channels verwendet werden kann. Ebenso wird 
nur eine geringe " Intelligenz ■ in jeder ein en IO-Channel aufweisenden PAE 
benfltigt, wodurch die PAEs jeweils flachenma&ig klein und unaufwendig zu 

30 programmieren sind. 

Die eigentliche Verwaltung und Ansteuerung der extemen Einheiten wird in den 
IOAGs durchgeftihrt, die durchaus grOfier und aufwendiger ausgestaltet sein 
k&nnen . 

35 Die IOAGs konnen zur Erfttllung ihrer Aufgabe selbst eigene Sequenzer und/ oder 
Mikrokontroller und ggf . auch eigenen Speicher aufweisen. Insbesondere kann 
die IOAG auch Speichermanagementeinheiten und Adressubersetzungseinheiten 
aufweisen. Je nach Appl ikation konnen Interruptkontr oiler wie z. B. nach dem 
Stand der Technik bekannte (18259) in der IOAG implementiert sein, die 

40 Interrupts ggf. auf Triggersignale nach DE 197 04 728.9 ttbersetzen. 

SIMD PAEs 

Bei der Verwendung von rekonf igurierbaren Technologien zur Verarbeitung von 
45 Algorithmen entsteht ein wesentliches Paradoxon: (1) es sind, um eine 

moglichst hohe Rechenleistung zu erhalten, komplexe ALUs erf orderlichr wobei 
der Auf wand ftir die Rekonf iguration minimal sein sollte; (2) es sollten die 

31 
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ALUs mdJglichst einfach und feingranular sein, um eine ef fiziente 
Datenverarbeitung auf Bitebene zu erm&glichen; (3) es sollte die 
Rekonfiguration und Datenverwaltung derart intelligent und schnell erfolgen, 
dafi sie ef fizient und einfach zu programmer en ist. 

5 

Bisherige Technologien verwenden entweder a) sehr kleine ALUs mit wenig 
Rekonfigurationsunterstatzung (FPGAs) und sind auf Bitebene ef fizient oder b) 
grofie ALUs (Cameleon) mit wenig Rekonf igurationsuntersttitzung, oder c) eine 
Mischung aus grofien ALUs und kleinen ALUs mit Rekonfigurationsunterstatzung 
10 und Datenverwaltung (VPUs) . 

Da die VPU-Technologie die leistungsfahigste Technik darstellt, soli auf ihr 
aufbauend ein optimiertes Verfahren geschaffen werden. Es soil ausdrtlcklich 
darauf hingewiesen werden, dafi dieses Verfahren ebenfalls fur die anderen 
Architekturen eingesetzt werden kann. 

15 

Der Flachenaufwand zur ef fizienten Steuerung von Rekonf igurationen ist mit 
einer Menge von ca. 10.000 bis 40,000 Gattera pro PAE vergleichsweise hoch. 
Unterhalb dieser Gattermenge las sen sich in der Regel nur einf ache 
Ablaufsteuerungen realsieren, die die Programmierbarkeit von VPUs erheblich 
20 einschranken und eine Verwendung als General Purpose Prozessor erschweren. 
Sofern auf eine besonders schnelle Rekonfiguration abgezielt wird, ratlssen 
zusatzliche Speicher verges eh en werden, wodurch die erforderliche Gattermenge 
nochmals erheblich ansteigt. 

25 Um ein ordentliches Vernal tnis zwischen Rekonf igurationsauf wand und 

Rechenleistung zu erhalten, ist somit der Einsatz von groBen ALUs (viel 
Funktionalitat und /oder grofie Bitbreite) zwingend er f order lich. Werden die 
ALUs jedoch zu grofi, sinkt die nutzbare parallele Rechenleistung pro Chip. 
Bei zu kleinen ALUs (z. B. 4-bit) ist der Aufwand zur Xonfiguration 

30 aufwendiger Punktionen (z.B. 32-bit Multiplikation) zu hoch. Insbesondere der 
Verdr ah tungs au f wand wSchst in kommerziell nicht mehr sinnvolle Bereiche. 



SIMP Rechenwerke 

35 Um ein ideales Vernal tnis zwischen der Verarbeitung von kleinen Bitbreiten, 
Verdr ahtungs au fwand und der Kon figuration aufwendiger Funktionen zu erhalten, 
wird nun der Einsatz von SIMD-Rechenwerken inner ha lb von ALU-PAEs (also 
insbesondere der in dieser Erfindung offenbarten PAEs, ebenso wie in PAEs 
nach DB 196 51 075.9-53 und DE 199 26 538.0 ) vorgeschlagen. Dabei werden 

40 Rechenwerke der Breite m derart zerteilt, dafi n einzelne Bldcke der Breite b 
= m/n entstehen. Durch Konfiguration wird je Rechenwerk vorgegeben, ob ein 
Rechenwerk unzerteilt arbeiten soli, oder ob das Rechenwerk in einen oder 
mehrere Blocke, jeweils gleicher oder unterschiedlicher Breite zerlegt sein 
soil. Mit anderen Worten kann ein Rechenwerk auch derart zerlegt sein, daS 

45 innerhalb eines Rechenwerke s unterschiedliche Wortbreiten zugleich 

konfiguriert sind (z.B. Breite 32-bit, zerlegt in 1x16-, 1x8- und 2x4 -bit) . 
Die Daten werden derart zwischen den PAEs ttbertragen, dafi die zerlegt en 

32 
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Datenworte (SIMD-WORD) zu Datenworten der Bitbreite m zusammengefaSt werden 
und als Paket ttber das Netzwerk ttbertragen werden. 

Das Netzwerk ttbertragt iramer ein komplettes Paket, d.h. alle Datenworte 
innerhalb eines Paketes, und werden nach dem bekannte Handshake-Verfahren 
5 tlbertragen. Einzelne Datenworte innerhalb des Paketes konnen dabei auch 

unbenutzt sein, d.h. keine Information enthalten. Dies kann durch zusatzliche 
Statusleitungen und/oder Handshakes ignal en wie z. B. dem RDY/ACK Protokoll 
realisiert sein. 

10 

SIMP Bussysteme 

Fur einen effizienten Einsatz der von SIMD-Rechenwerken ist eine flexible und 
effiziente Hmsortierung der SIMD-WORD untereinander innerhalb eines Busses 
oder zwischen unterschiedlichen Bussen erforderlich. 

15 Die Busschalter nach Figur llkBnnen der art modif iziert werden, daJB eine 
flexible Verne tzung der einzelnen SIMD-WORD moglich ist. Dazu werden die 
Busse ttber beispielsweise Multiplexer, Busschalter, Transmissiongates, Pass- 
Transistoren (nachfolgend unter dem Begrif f Multiplexer zusammengefaSt) 
entsprechend den Rechenwerken teilbar ausgelegt, der art dafi durch 

20 Konfiguration die Teilung bestimmt werden kann. Mit anderen Worten wird 

beispielsweise nicht ein Multiplexer der Breite m pro Bus verwendet, sondern 
n einzelne Multiplexer der Breite b = m/n. Es ist nunmehr mdglich, die 
Datenbusse fttr b bit Breite zu konf igurieren . Durch die Matrixs truktur der 
Busse (Figur 11) ist die Umsortierung der Daten ebenfalls moglich, wie in 

25 Figur 12a dargestellt. 

Die Handshakes der Busse werden logisch derart verkntipft, dafi ein gemeinsamer 
Handshake fttr den neu geordneten Bus aus den Handshakes der ursprttnglichen 
Busse generiert wird. Beispielsweise kann ein RDY fttr einen neu sortierten 

30 Bus aus einer logischen UND-Verkntlpfung aller RDYs der Daten fttr diesen Bus 
liefemden Busse generiert werden. Ebenso kann beispielsweise das ACK eines 
Daten liefemden Busses aus einer DND-Verknttpfung der ACKs aller Busse 
generiert werden, die die Daten weiterverarbeiten. Prinzipiell sind bei der 
Implementierung geeignete Verknttpfungen dergestalt zu wahlen, dass diese den 

35 jeweils verwendeten Busprotokollen entsprechen. 

In einer ersten Ausftthrungsvariante f inden die Verknttpfungen der Handshakes 
innerhalb eines jeden Busknotens statt. Dadurch wird es moglich, einem 
Bus system der Breite m, bestehend aus n Teilbussen der Breite b, bevorzugt 
40 nur eiri Hand- shake- Protokoll zuzuordnen. 

In einer weiteren besonders bevorzugt en Ausgestaltung werden samtliche 
BusBysteme in der Breite b ausgestaltet, die die kleinste realisierbare Ein- 
/Ausgabe Datenbreite b eines SIMD-Word entspricht. Entsprechend der Breite 
45 der PAE Datenpfade (m) besteht nunmehr ein Ein-/Ausgangsbus aus m/b = n 
Teilbussen der Breite b. Beispielsweise besitzt eine PAE mit 3 32bit 
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Eingangsbussen und 2 32 bit Ausgangsbusse bei einer kleinsten SIMD-Wortbreite 
von 8 tatsachlich 3x4 8bit Eingangsbusse und 2x4 8bit Ausgangsbusse. 
Jeder der Teilbusse weist bevorzugt samtliche verwendeten Handshake- und 
Steuersignale auf, beispielsweise RDY/ACK und der Reconflg -Trigger nach DE 
5 197 04 728.9 und ein global es Reset Signal, etc. 

Der Ausgang einer PAG versendet bevorzugt dieselben Steuersignalen fur 
samtliche n Teil -Busse. Eingehende Quittierungssignale aller Teilbusse werden 
bevorzugt miteinander logisch verkntlpf t, z. B. durch eine UND-Funktion. Die 
Bussysteme k&nnen jeden Teilbus frei verschalten und unabhangig routen. Die 
10 Bussysteme und insbesondere die Busknoten verarbeiten und/oder verkntlpf en die 
Handshake- Signal e der einzelnen Busse unabhangig ihres Routings, ihrer 
Anordnung und Sortierung nicht. 

Bei in einer PAE eingehenden Daten werden die Steuersignale samtlicher n 
Teilbusse derart miteinander verkntlpf t, dass ein allgemeingtlltiges 

15 Steuersignal quasi als Bussteuersignal fur den Datenpfad generiert wird. 
Beispielsweise kOnnen in einer "dependend" Betriebsart RdyHold-Stufen fur 
jeden einzelnen Datenpfad eingesetzt werden und erst, wenn samtliche RdyHold- 
Stufen anstehende Daten signalisieren, werden diese von der PAE Obemommen. 
In einer ■independend" Betriebsart werden die Daten jedes Teilbusses einzeln 

20 in Eingangsregister der PAE geschrieben und quittiert, wodurch der Teilbus 
sofort fur eine nachste Datenubertragung frei ist. Das Vorhandensein aller 
erforderlichen Daten von alien Teilbussen in den Eingangsregistem wird 
innerhalb der PAE durch geeignete logische Verkntlpf ung der fur jeden Teilbus 
im Eingangsregister gespeicherten RDY-Signale detektiert, woraufhin die PAE 

25 iuit der Datenverarbeitung beginnt . 

Der wesentliche daraus result ierende Vorteil dieses Verfahrens ist, dass die 
SIMD-Eigenschaf t von PAEs keinerlei besonderen Einflufi auf das verwendete 
Bussystem auf weist. Es werden lediglich mehr Busse (n) einer geringeren 
30 Breite (b) bendtigt. Die Verschaltung selbst bleibt unberUhrt. Die PAEs 
verkntlpf en und verwalten die Steuerleitungen lokal. Dadurch entfallt der 
zus&tzliche Hardware auf wand in den Bussystemen zur Verwaltung und/oder 
Verknilpfung der Steuerleitungen. 

35 Figur 11 zeigt einen mftglichen und besonders bevorzugt en Aufbau einer 

Busstruktur fttr VPTJ-Architekturen. Die Ausgabeschaltung einer Punktionszelle 
z. B. (PAE , FREO/BREO) (1103, entspricht 0803a, b) ist tiber einen vertikalen 
Bus mit dem horizontalen Bussystem (1102, entspricht 0105) verbunden. 
Entsprechend greifen die Eingabeschaltungen der Funktionszellen (1101, 

40 entspricht 0801, 0802) tiber einen vertikalen Bus Inf ormationen von dem 

horizontalen Bussystem ab. In der Figur wird nunmehr verdeutlicht, wie ein 
derartiger Abgriff , bzw eine derartige Aufschaltung erfolgen kann. 
Wie in Fig. 11a dargestellt erfolgt das Auf schal ten eines Ausgabebusses 
(1111) von 1103 auf 1102 durch ein •Auftrennen - eines Busses des horizontalen 

45 Bussystems 1102 und das Einftigen von horizontalen Schaltern (1112), die durch 
Switches, Transmission-Gates , Multiplexer oder ahnlichen geeigneten 
Bauelementen realisiert sein kOnnen. Abhangig von dem Wert eines Dekoders 
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und/oder Konfigurationsbits (angedeutet durch das Schalter symbol 1113), das 
entsprechend der bekannten Konf igurationsverf ahren bevorzugt in einem 
Konfigurationsregister der PAE angeordnet 1st und konfiguriert wird, 
verbindet der Schalter entweder die beiden Half ten des horizontal en Busses 
5 1102 miteinander oder schaltet den Bus 1111 auf die eine Half te von 1102 auf , 
die andere Haifte von 1102 1st dann unterbrochen und wird nicht 
weitergeleitet . Die Schaltung wird bevorzugt fur jeden Bus des horizontalen 
Bussystems verwendet. 

Figur lib zeigt die entsprechende Schaltung zum Abgriff von Daten von 1102 

10 und zur Weiterleitung derer an 1101. uber vertikale Schalter (1122), die 
durch Switches, Transmission-Gates, Multiplexer oder a hn lichen geeigneten 
Bauelementen realisiert sein kGnnen, werden Daten bitweise von den Bussen des 
horizontalen Bussystems (1102) abgegriffen und auf den vertikalen Bingangsbus 
(1121) zur Eingabeschaltung 1101 Uber tragen . Die Ansteuerung der vertikalen 

15 Schalter, d.h. ihre Schaltfunktion, erfolgt durch Dekoder und/oder 
Konfigurationsbits (angedeutet durch die Schaltersymbole 1123), die 
entsprechend der bekannten Konf igurationsverfahren bevorzugt in 
Konf igurationsregistem der PAE angeordnet sind und konfiguriert werden . 
Fig. lib und bei entsprechender Modifikation auch Fig. 11a lassen n:l 

20 Datenubergange zu, d.h. mehrere Busse konnen zu einem Bus zusammengefafit 
werden, d.h. die Daten roehrer Busse werden auf einem Bus zusammengefOhrt. 
Fig. 11c zeigt die Busauf trennfunktion der horizontalen VPU-Bussysteme 
(1102). Jeder horizontale Bus einzeln und je fur sich kann an der 
Ausgabeseite der PAE-Kante aufgetrennt werden. Eine Anftrennung kann durch 

25 Multiplexer oder Schalter erfolgen, wie in Figur 11c angedeutet werden soil. 
Je nach Konfigurationsbit 1132, das bevorzugt fur jeden Bus des Bussystems je 
einzeln zur VerfOgung steht, wird die Datenubertragung auf das 
danebenliegende Bussystem (1131) freigeschaltet oder unterbunden. 
Typischerweise wird diese Funktion in den Schaltern nach Figur 11a 

30 realisiert, indem die Information des Konfigurationsbits 1132 an die Schalter 
(1112) des dan ebenl legend en Bussystems (1131) uber tragen wird und 
entsprechend die Schalter zur Weiterleitung ermachtigt (enabled) oder die 
Schalter sperrt (disabled) . 

35 Figur 12a zeigt ein SIMD-Bussystem entsprechend Figur 11. Dargestellt ist ein 
vereinfachtes horizon tales Bussystem 1102 , eine PAE Ausgabeschaltung 1103 und 
eine PAE Eingabeschaltung 1101. Jede Eingabeschaltung weist beispielhaft 2 
Eingabebusse der Breite 32 bit auf (1201, 1202), jede Ausgabeschaltung 2 
entsprechende Ausgabebusse (1203, 1204). Jeder der Busse (1201, 1202, 1203, 

40 1204) ist in 4 Teilbusse zu je 8-bit aufgeteilt, die wie dargestellt jeweils 
unterschiedlich und unabhangig geroutet werden konnen, einige der Teilbusse 
werden nicht verwendet (gepunktete Linie) . Die flexible Verschaltung wird 
dadurch erreicht, dass die Schalter nach den Figur en lla-c fur jeden Bus 
der art getrennt aufgebaut sind, dass je ein Teilbus von einem Schalter mit 

45 eigener Konf iguration verwaltef wird. Dadurch ist das Bussystem f eingranular 
verschaltbar. 
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Figur 12b zeigt eine SIMD-Datenverarbei tung , bei welcher samtliche Busse 
(1211) dasselbe Handshake (1212) aufweisen. Die Busse werden innerhalb einer 
PAE in die Teilbusse getrennt und in den SIMD-ALUs (1213, 1214) getrennt 
verarbeitet. Die gemeinsamen Handshakes steuem die Ablaufsteuerung (1215) 
5 der PAEs an, bzw. werden von dieser generiert. 

Figur 12c 2eigt eine SIMD-Datenverarbeitung, bei welcher samtliche Busse 
vollkommen getrennt sind (1221) getrennte Handshakes (1222) aufweisen. Die 
Busse in den SIMD-ALUs (1223, 1224) getrennt verarbeitet. Die getrennten 
10 Handshakes steuern die Ablaufsteuerung (1225) der PAEs an, bzw. werden von 
dieser generiert. 



Einsatz von FPGAs als ALU-Core 
15 In PACT13 ist bereits eine Architektur beschrieben, in welcher anstatt einer 
ALU eine FPGA Oder FPGA-ahnliche Struktur in eine PAE integriert wird. Diese 
Struktur wird innerhalb einer PAE gemaS den FPGA Konf igurationsmethoden nach 
dero Stand der Technik konfiguriert, d. h. die erweiterten 

Konfigurationsverfahren nach PACT02, 04, 05, 10, 13, 17 finden auf die FPGA- 
20 Struktur keine Anwendung. Dadurch sind Auf wand und Kosten fur die 

Konfigurationssteuerung der verbal tnismafiig kleinen FPGA-Zellen gering. Die 
PAE allerdings, die die FPGA-Zellen enthalt, verhalt sich gemafc des VFU- 
Konfigurationsverfahrens nach den o. g. Schriften. Dadurch- ist die FPGA- 
Struktur in der PAE- Struktur gekapselt und verhalt sich wie ein PAE-Objekt 
25 mit vielen Konf igurationsregistem. 

Dadurch lassen sich auch beliebige Operation en auf ein Array aus FPGAs 
abbilden. GeroaE DE 101 35 210.7-53 ist eine Mischung aus ALU- PAEs und FPGA- 
PAEs innerhalb einer VPU moglich und durchaus sinnvoll. 

30 Es ist anhand des Anwendungsgebietes zu entscheiden, ob ein mehrfacher Satz 
an Konfigurationsregistem fur die FPGA-Zellen sinnvoll ist, da deren Anzahl 
sehr hoch ist. Gegebenenfalls werden Konf igurationsregister zum schnellen 
Umkonfigurieren einer FPGA- PAE gemafi DE 196 51 075.9-53 , DE 199 26 538.0 
und insbesondere DE 100 28 397.7 Fig. 18 und 19 als Register-File Oder FIFO- 

35 Struktur innerhalb der PAE realisiert und von dort aus in die FPGA-Zellen 
geladen . 

Es hat sich mittlerweile als besonders vorteilhaft herausgestellt, wenn 
innerhalb einer ALU- PAE eine FPGA Struktur der ALU zugeordnet wird, indem die 
40 FPGA- Struktur vor und/oder nach und/oder parallel zur ALU angeordnet wird. 
Bevorzugt ist eine Ausfuhrung in welcher die FPGA-Struktur der ALU 
nachgeechaltet wird. 

Der Vorteil liegt darin, dass nur relativ kleine FPGA- Struktur en verwendet 
werden mttssen, da samtliche arithmetischen Opera tionen weiterhin in der ALU 
45 ablaufen. Dadurch wird eine besonders hohe Kos ten/Performance Effizienz 

erreicht. Una kleine Wortbreiten zu unterstatzen (4-bit, 8-bit, etc.), bietet 
es sich besonders an, die vorab beschriebenen SIMD-ALUs einzusetzen. 
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Durch die Nachschaltung von FPGA-Strukturen hinter einer ALU lass en sich 
insbesondere Correlatoren und PNG-Generatoren besonders effizient aufbauen. 

Der Einsatz von VP0 Architekturen bietet sich mi ttlerweile' insbesondere ftlr 
5 den Ersatz von ASICs bei mittleren und niederen Stttckzahlen an. Dieses 
Einsatzgebiet der VPU Bausteine weist die Besonderheit auf, dass die 
Applikationsf elder sehr klar definiert sind und haufig nur einige wenige 
Applikationen auf den Bausteinen ausgefuhrt werden. Besonders diese 
Einsatzgebiete benOtigen haufig feingranulare FPGA-Strukturen zur bitweisen 

10 Verarbeitung von Daten. 

Durch die Limitierung auf wenige Anwendungen sind hier die mfiglichen 
Konfigurationen der FPGAs ebenfalls sehr begrenzt und vorhersagbar . 
Es wurde erkannt, dass es beispielsweise insbesondere ftlr diese 
Einsatzgebiete lohnend ist, die Rekonfiguration der FPGA-Strukturen von der 

15 schnellen Rekonfiguration der grobgranularen Strukturen abzusetzten. Mit 

anderen Worten werden fur die FPGAs langsamere (z. B. herk&nmliche serielle) 
Rekonfigurationsverfahren verwendet, die au&erst kosten- und f lachenef f izient 
realisierbar sind. 

Dazu kann (1) ein vollkommen separates Konfigurationssystem bestehend aus 
20 Bussystem und Konf igurationskontrollern auf gebaut werden, wie dies von FPGAs 
nach dera Stand der Technik bekannt ist. (2) kOnnen die 

Konf igurationsressourcen der VPU Technologie benutzt werden, ohne dass jedoch 
Ressource fur besondere beschleunigende Massnabmen zur Verftigung gestellt 
werden. Beispielsweise kann der Zugriff auf den FILMO nach DE 196 54 593.5-53 

25 , DE 198 07 872.2 ftlr FPGA-Strukturen ausgeschlossen sein, ebenso wie das 

Vorhandensein von Konfigurationsregisters tacks nach DE 100 28 397.7 Oder wie 
nachfolgend beschrieben. Ebenfalls kann die Untersttltzung der schnellen Wave- 
Rekonfiguration nach DE 199 26 538.0 , DE 100 28 397.7 entfallen. Es ist 
etwa mSglich, einem FPGA-Array eine PAE zur Umkonf igurierung zuzuordnen. Hier 

30 rauS lediglich die PAE dazu konfiguriert werden, die FPGA-Struktur zu laden, 
was wie vorstehend beschreiben, durch PAE-gesteuerten, eigens tandigen Zugriff 
auf Da ten von aufien geschehen kann. 

Insbesondere bietet es sich aus Kostengrtlnden an anstatt der mehrfach 
rekonfigurierbaren Architekturen ressourcensparende "eimnal konfigurierbare" 

35 Architekturen einzusetzen. Die VPU- Bausteine werden dann einmal vor ihrer 
Aus lief erung an den Kunden oder beim Kunden bzw. durch den Kunden 
personalisiert, d. h. die FPGA-Strukturen werden auf ihre durchzuftlhrende 
Funktion konfiguriert. Die Funktion der FPGA-Strukturen ist sodann im 
weiteren unabanderlich, wahrend samtliche verbleibenden Funktionen, wie die 

40 der ALUs und der en Vemetzung r weiterhin vollstandig laufzeitrekonf igurierbar 
entsprechend der VPU-Technologie ist 

Als •einmal konf igurierbare - Technologien bieten sich besonders die bekannten 
ROM, EPROM, EEPROM, FLASH basierenden Verfahren an. Es soil insbesondere 
erwahnt sein, dass sich die bekannten Fuse und Anti fuse- Verfahren (z.B. 
45 Atmel, Actel, Quicklogic) besonders zur Realisierung derartiger "einmal 
pr ogramraierbar er " FPGA-Strukturen eignen. 



37 



WO 03/036507 PCTYEP02/10572 



Auf den prinzipiellen Aufbau derar tiger Strukturen soil hier nicht weiter 
eingegangen werden, da dieser durch den einschlagigen Stand der Technik, 
insbesondere den Patenten der o. g. Firraen, hinreichend bekannt 1st. 

5 Figur 8 zeigt beispielhaft eine erfindungsgemaSe PAE. Dargestellt 1st der 
Datenpfad der PAE. Die Verbindung zu dem Bussystem 0105 wird durch die 
bevorzugt Register enthaltende Ei ngabebaugruppe 0801 und 0802 und die 
ebenfalls bevorzugt Register enthaltende Ausgabebaugruppe 0803 real isiert. 
Der ALU (0804) nachgeschaltet ist eine Funktionseinheit aus feingranularen 

10 F PGA- Z ell en (0805), die tiber einen Busstruktur miteinander verbunden sind. 
Der Ausgang von 0804 wird auf diese Busstruktur auf geschaltet, die 
• Busstruktur wiederum ist rait 0803 verschaltet. Optional und bevorzugt kann 
mittels eines Multiplexers ein Bypass des Ausgangs von 0804 direkt auf die 
Ausgabebaugruppe 0803 an 0805 vorbei geschaltet werden. 

15 In die FPGA-Zellen konnen mehrere Stufen Logik konfiguriert werden, 

insbesondere saint liche oder einige der folgenden Funktionen; Multiplexer, 
AND, OR, XOR, NOT Funktionen, Halb- addierer, Vergleicher, Schieberegister, 
Register, Boolsche Lookup-Tabellen . 

Die FPGA-Zellen (0805) kSnnen durch den Konfigurationsbus (0404) der PAE 
20 konfiguriert werden. Bevorzugt werden besondere konf igurationsbeschleunigende 

Baugruppen, wie z. B. Konf igurationsstacks (0406) nicht zur Konf iguration von 

FPGA-Zellen benutzt. Diese Baugruppen werden ggf . fur derartige 

Konf igurationsda ten passiv geschaltet oder die Konf igurationsda ten werden an 

ihnen vorbei geleitet. 
25 In einer besonderen Ausgestaltung ist eine permanente einmalige Konf iguration 

der FPGA-Zellen unter Verwendung von ROM- Element en wie z . B. EPROM, EEPROM, 

Flash-ROM oder Fuse-/Antifuse-Technologien vorgesehen. 

Figur 9 zeigt mogliche erfindungsgemaSe Ausgestaltungen von PAEs. Es soil 
30 ausdrticklich darauf hingewiesen werden, dass die Ausgestaltung in Figur 9a 
und die in Figur 9b auch gleichzeitig zusammen in einer PAE implementiert 
sein konnen. 

Figur 9a zeigt den Anschlufi eines Registerfiles (0901) (z.B. R0..Rn) an einen 
35 Kern (0902), der beispielsweise aus einer ALU wie 0804 oder einer ALU (0804) 
und FPGA-Zellen (0805) bestehen kann. 

Die Ergebnisdaten des Kerns werden zu den Regis tern 0901 gefuhrt und dort je 
nach Operation eingespeichert . Die Register 0901 werden tiber Muliplexer 
(0903, 0904) je nach durch zuftthrenden Operation auf die Eingange der ALU 
40 gefuhrt. 

Figur 9b zeigt eine ahnliche Struktur, bei welcher eine zusatzliche 
Aufschalteinheit (0911) fur einen dedizierten globalen Bus (0912) (z.B. 10- 
Channel) implementiert ist. Die Ergebnisdaten des Kerns werden zu der 
45 Aufschalteeinheit 0911 gefuhrt und dort je nach Operation auf den globalen 
dedizierten Bus (0912) tiber tragen. Fur die PAE bestiitrote Daten von 0912 
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werden Uber Muliplexer (0903, 0904) je nach durchzufuhrenden Operation auf 
die Eingange der ALU gefuhrt. 

Optional kann die Auf schalteeinbeit 0911 uber die Busauf schalteeinheiten 0913 
und 0914 Daten direkt von dem Bussystem 0105 lesen Oder auf dieses 
5 uber tragen . 

Figur 10a zeigt die Verwendung von dedizierten globalen Bussystemen innerhalb 
eines Arrays aus PAEs (1001) . Insoweit entspricht die Darstellung des PAs aus 
Figur 1 (0101) . Jeweils eine Menge von PAEs (1001) 1st an die globalen 

10 dedizierten Bussysteme 1002, 1003, 1004 angeschlossen und kann Daten auf 
diese Senden oder von diesen Empfangen. Die Datenubertragung kann sowohl 
zwischen den PAEs, als auch zwischen PAEs und IO stattfinden. Es ist 
dargestellt, dass PAEs auch an mehrere globalen dedizierten Bussysteme 
gleicbzeitig angeschlossen sein konnen, wahrend andere PAEs m&glicherweise 

15 keinen Anschluss aufweisen, 

Figur 10b zeigt beispielsweise den Anschlufi eines globalen dedizierten Busses 
(beispielsweise 1002 oder 1003 oder 1004), der innerhalb des Arrays aus PAEs 
(0101) mit einigen PAEs (1001) verbunden ist, an auSerhalb des 0101 liegende, 
ggf . auch bausteinexteme Baugruppen. Die Baugruppen kOnnen beispielsweise 

20 Peripherie (1011) und /oder Speicher (1012) sein. Zum AnschluS der auSerhalb 
liegenden Baugruppen (1011, 1012) kann ggf. eine Anpassung der Signale (z. B. 
Spannungen: CMOS, TTL, LVDS, etc.) stattfinden. 

Figur 10c zeigt ein Beispiel fur den Anschlufi eines globalen dedizierten 
25 Busses (beispielsweise 1002 oder 1003 oder 1004) , der innerhalb des Arrays 
aus PAEs (0101) mit einigen PAEs (1001) verbunden ist, an eine Interface- 
Baugruppe (1021) . Die Interf ace-Baugruppe ubersetzt die Protokolle und/ oder 
Signale des intemen dedizierten Busses auf einen oder mehrere auSerhalb 
liegenden Busse. In dem aufgezeigten Beispiel sind 2 auSerhalb liegende Busse 
30 (1022, 1023) implementiert. Die Bussysteme sind bevorzugt unterschiedlicher 
Ausgestaltung, beispielsweise kann 1022 ein Speicher bus system fur Speicher 
(1024) wie SDR-RAMs, DDR-RAMs, RAMBUS o.a\ sein, wahrend 1023 ein 
Peripheriebussystem fur Peripherie- und/oder IO-Gerate (1025) darstellt, wie 
z. B. PCI oder ein serielles Protokoll wie USB, FireWire, Ethernet. 

35 

Konf iauration komplexer Rechenwerke 

Komplexe Rechenwerke (z. B. Floating-Point Rechenwerke) konnen durch die 
geeignete Verschaltung und Gruppierung von konf igurierbaren Zellen (PAEs) 
40 mttglicherweise auch unterschiedlicher Bauart (RAM- PAEs, ALU- PAEs, Bussen) 
realisiert werden. 

Beispielsweise kann ein Floating-Point Rechenwerk durch eine geeignete 
Verschaltung von mehreren ALU- PAEs, die die arithmetischen Operation en uber 
Exponent und Mantisse durchfuhren erreicht werden. Bevorzugt werden den ALU- 
45 PAEs die in der VPU des Anmelders (XPP-Technologie) integrierten Forward- und 
Backward-Register (FREG/BREG) zugeordnet, urn die notwendigen Normi erungen 
durch Schiebeoperationen der in den FREG/BREG angeordneten Barrel -Shifter 
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durcbzufuhren. Damit lassen sich Floating-Point Rechenwerke bei Bedarf auf 
Basis der Integer-ALUs mit hoher Flachenef fizienz aufbauen. 
Bin Vorteil des Verfahrens liegt darin, dass keine Siliziuro-Flache fur fest 
integrierte Floating-Point Rechenwerke verwendet werden muss. Da Floating- 
5 Point-Operationen relativ zu den Integer- Opera tionen nur s el ten gebraucht 
wird, steigt damit das Kosten/Nutzen-Verhaltnis erheblich an. 
Compiler, die Hochsprachenprogramme auf eine VPU libers etzen, konnen durch 
Makroexpansion und/oder mittels Lauf zeit-Bibliotheken entsprechende 
vorgefertigte komplexe Strukturen in den Maschinencode (z. B. NML) 
10 ubernehmen . 

Fttr Maschinencode- Programme (z. B, NML) bieten sich besonders Library-Calls 
auf Bibliotheken an, die die entsprechenden komplexen Funktionen vorgefertigt 
en thai ten. 

15 

J9tatema chines tiber RAM- PAEs 

Mit einem Array aus PAEs verbundene RAM-PAEs konnen zum Aufbau von Sequenzern 
eingesetzt werden. Das Grundprinzip beruht darauf , dass Ausgangsdaten eines 
Speichers auf dessen Adresseingang zurtickgekoppelt wird. Die Rtickkopplung 
20 erfolgt bevorzugt uber ein taktgesteuertes Registers. Dadurch entsteht ein 
Sequenzer, dessen jeweils nachfolgender Zyklus durch den jeweils aktuellen 
Zyklus vorgegeben ist. 

Teile der Ausgangsdaten (CONTROL- Signal e) konnen nunmehr an andere Baugruppen 
und/oder Funktionszellen (PAEs) und/oder auch an externe Gerate ubertragen 

25 werden, um dort bestimmte Vorgange auszulosen. Besonders bevorzugt sind zwei 
Gbertragungsarten, die zumeist gemeinsam angewendet werden: 
a) die tfbertragung Qber einen Datenbus, bevorzugt inbesondere als SIMD-Bus 
gemafi der vorstehenden Erlauterung ausgestaltet, wodurch eine teilweise 
tibertragung der Ausgangsdaten besonders effizient realisierbar ist. 

30 b) die Obertragung uber einen Triggerbus, dessen bevorzugte Ausgestaltung und 
Arbeitsweise in PACT08 beschrieben ist. uber Triggerbusse konnen Zustande und 
Bed in gun gen zur Ablauf steuerung von Baugruppen und/oder Funktionszellen 
(PAEs) und/oder auch extern en Geraten besonders effizient ubertragen werden. 



35 Der Aufbau der Eingangsadressen, bzw. Ausgangsdaten ist wie . 
folgt(Darstellung: hBherwertige Bits ... niederwertig Bits): 
Adresse: 

[Adresse des aktuellen Zyklus I 



Da ten: 

[Adresse des nachs ten Zyklus CONTROL- Signal e 



40 



Es bleibt zu erwahnen, dass die Eingangsdaten typischerweiee nicht verwendet 
werden, d.h. auf den Speicher wird nur lesend, nicht schreibend zugegrif f en. 
Der Inhalt des Speichers (z.B. RAM-PAE) wird durch eine Konfigurationseinheit 
vorkonf iguriert. Deshalb kann der Speicher insbesondere auch als 
45 nichtf lOch tiger einmal programmierbarer Speicher mit ROM, EPROM, EEPRCM, 
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Plash Zellen Oder basierena auf Fuse oder Antifuse Technologien aufgebaut 
sein. Der Speicher wird dann, wie vorab bereits beschrieben, vor der 
Auslieferung an den Kunden oder beim Kunden personalisiert, d.h. 
prograramiert . 

5 

Ein Speicherzugrif f durch andere PAEs ist grundsatzlich moglich, um den 
Sequenzer z.B. im Betrieb zu modif izieren, soli aber aufgrund des begrenzten 
Einsatzbereichs hier nicht weiter detailliert ausgefuhrt werden. 

10 Der erfindungsgemafce Sequenzer kann durch folgende Erweiterungen in seiner 

Abfolge von Zyklen auf Ereignisse reagieren und insbesondere bedingte Sprunge 
durchfuhren: 

Ein Teil, bevorzugt der niederwertige, der Eingangsadressen zu dem Speicher 
wird als Eingang fur weitere Zustandssignale verwendet. Diese Zustandssignale 

15 konnen durch die vorstehenden tibertragungsarten ubertragen werden und sorait 
Daten oder Trigger sein. Bei der Selection des nachf olgenden Zyklus wird 
nunmehr eine mogliche Menge von Zyklen durch die Datenruckkopplung auf die 
bevorzugt hohen Adressbits bestimmt und der best innate Zyklus wird dann aus 
der mBglichen Menge durch die Zustandssignale auf den niederen Adressbits 

20 selektiert. 

Daraus resultiert folgender Aufbau der Eingangsadressen, bzw. Ausgangsdaten 
wie folgt (Darstellung: hOherwertige Bits . niederwertig Bits): 
Adresse : 



25 



Adresse des 
aktuellen Zyklus 



Zustandssignale 



Daten: 

I Adresse des nachsten Zyklus | CONTROL- Signal e" 



30 



40 



Somit ist ein vollwertiger Sequenzer definiert, der den Grundprinzipien der 
Mealy-Moore Sequenzern entspricht. 



Die Zustandssignale und/oder Control- Signale kOnnen nunmehr ggf . zu Bttndeln 
zusammengef a£t der art gruppiert werden, dass je eine Gruppe bestimmten 
Sendem/Empfangern zur Verfugung stent, z.B. eine Gruppe fur 0101-inteme 
PAEs und eine Gruppe fur externe Baugruppen und eine Gruppe zur 
35 Konfigurationseinheit. 

Mit anderen Worten werden samtliche Sprunge durch die Angabe der -Adresse des 
nachsten Zyklus* realisiert. Bedingungen werden durch die Zustandssignale 
realisiert. 



Das dabei auftretende Problem ist, wie sog. don*t cares, also bestimmte 
Zustandssignale, der en Wert zu einem Zyklus bedeutungslos ist, behandelt 
werden. Die bevorzugte Variante liegt darin, fur samtliche mOglichen Werte 
dieselben Daten festzulegen. 
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10 



Bei spiel: 

Innerhalb einer f olgendermassen aufgebauten Adresse 



Adresse des 
aktuellen Zyklus 



Zustandssignale 



soil die "Adresse des aktuellen Zyklus' (Cycle) beispielhaft gleich 0x60, 
entsprechend CYCLE60 sein. Es sind 4 Zustandssignale (ZS0..3) vorgesehen, von 
denen innerhalb des beispielhaf te Zyklus' 2 (ZS3 und ZSl) je nach Wert zu 
anderen Sprungzielen fuhren, also beispielhaft nach CYCLE10, CYCLE7, CYCLES 9, 
CYCLES 6 . 

Die Tabelle sieht nunmehr wie folgt aus: 



Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZSl 


zso 




CYCLE60 


0 


? 


0 


? 


CYCLE10 


CYCLES 0 


0 


? 


1 


? 


CYCLE7 


CYCLES 0 


1 


? 


0 


? 


CYCLES 9 


CYCLES 0 


1 


? 


1 


? 


CYCLES 6 



Die don't cares (ZS2, ZSO) werden nunmehr so belegt, dass der Wert ihres 
Signales keinen Einflufi auf die Zuordnung der Adresse zu den Daten hat: 



Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZSl 


zso 




CYCLES 0 


0 


0 


0 


0 


CYCLE10 


CYCLES 0 


0 


0 


0 


1 


CYCLE10 


CYCLES 0 


0 


0 


1 


0 


CYCLE7 


CYCLE 60 


0 


0 


1 


1 


CYCLE7 


CYCLE60 


1 


0 


0 


0 


CYCLE89 


CYCLES 0 


1 


0 


0 


1 


CYCLES 9 


CYCLE 60 


1 


0 


1 


0 


CYCLES 6 ! 


CYCLES 0 


1 


0 


1 


1 


CYCLES 6 


CYCLES 0 


0 


1 


0 


0 


CYCLE10 


CYCLE 60 


0 


1 


0 


1 


CYCLE10 


CYCLES 0 


0 


1 


1 


0 


CYCLE7 


CYCLES 0 


0 


1 


1 


1 


CYCLE7 


CYCLE60 


1 


1 


0 


0 


CYCLE89 


CYCLES 0 


1 


1 


0 


1 


CYCLE89 


CYCLE60 


1 


1 


1 


0 


CYCLES 6 


CYCLES 0 


1 


1 


1 


1 


CYCLES 6 



15 

Jeder Zielzyklus ist nunmehr 4-fach gespeichert, entsprechend alien binaren 
Kombinationsmoglichkeiten der don't care. 



Eine weitere optional e, aber sinnvolle und daher bevorzugte 
20 Ausaestaltungsmttglichkeit des Sequenzers sieht einen zusatzlichen Teilbereich 
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der Ausgangsdaten fur eine Selektor- und/oder Vergleichsmaske ftir die 
Zustands signale vor. Bei der Verwendung als Selektor konnen z.B. durch die 
Ansteuerung von Multiplexer]! durch die Selektorroaske eine Teilmenge von 
Zustandssignalen aus mehreren mOglichen ausgewahlt werden. Die zusatzliche 
optionale Vergleichsmaske kann als Vergleichsoperator fttr einen Vergleicher 
dienen, der entsprechend ein Statusbit (gleich/nicht gleich) aus einer Menge 
von Statusbits generiert. Ebenfalls kann die Vergleichsmaske zur Deselektion 
von don't care Signal en dienen, z.B. ttber eine normale Maskenoperation durch 
Verundung nach dem Stand der Technik (siehe PACT10) . 

Der Aufbau der Ausgabedaten ist dann wie folgt; 



Da ten: 



Adresse des nSchsten 


CONTROL- S ignale 


Selektor /Vergl ei chsmaske 


Zyklus 







15 

Ein bevorzugter Sequenzer kann beispielsweise wie folgt aufgebaut sein: 
Der Adressbus einer RAM-PAE, die als Sequenzer speicher verwendet wird, wird 
in mehrexe Teiladressen beliebiger und insbesondere moglicherweise auch 
unterschiedlicher Breite aufgeteilt, beispielsweise Bit 0..3 fur eine erste 
20 Teiladresse (NEXT_jCYCLE) , Bit 4. ,7 fur eine zweite Teiladresse (SEQUIN) und 
Bit 8.. 12 fttr eine dritte Teiladresse <CTRL_IN) . 

Der Datenausgang einer RAM-PAE wird in mehrere Teildaten beliebiger und 
insbesondere moglicherweise auch unterschiedlicher Breite aufgeteilt, 
beispielsweise Bit 0..3 fttr die ersten Teildaten (CYLCE) , Bit 4.. 7 ftir die 
25 zweiten Teildaten (SEQUDDT) und Bit 8.. 12 ftir die dritten Teildaten 
(CTRL_OUT) . 

Zur Auf teilung der Adressen und/oder Daten kann insbesondere das beschriebene 
SIMD PAE- und Bus-Konzept verwendet werden. Weiterhin kann die Auftrennung 
30 innerhalb der RAM-PAE erfolgen, 

Der RAM-PAE kdnnen datenverarbeitende PAEs zugeordnet werden, wie z. B. ALU- 
PAEs. 

35 Die Festlegung des nachsten Zyklus ses innerhalb eines Sequenzerdurchlaufs 
erfolgt durch die Rttckkopplung von NEXT_CYCLE auf CYCLE. 

In einer erweiterten Ausftthrungsvariante konnen zusatzliche 
datenverarbeitende PAEs zur Berechnung von CYCLE in Abhangigkeit von 
40 NEXTjCYCLE innerhalb der Rttckkopplung vorgesehen sein. Diese PAEs konnen auf 
beliebige, insbesondere auch zusatzliche Signale, Daten Oder Zustande 
anderer PAEs und/oder extemer/ peripherer Baugruppen reagieren. Desweiteren 
kdnnen diese PAEs zusatzliche Signale oder Daten erzeugen. 



5 



10 
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Zur Realisierung eines erweiterten Sequenzers k6nnen weitere PAEs angekoppelt 
sein, die in einer radglichen Ausgestaltung auch in ihrer Funktion und/oder 
Vernetzung vom Sequenzer beeinflufit werden kOnnen. Dazu kann der Sequenzer 
Daten in die Konf igurationsregister der entsprechenden PAEs ttbertragen. Ein 
5 Zugriff auf die Konf igurationsregister kann beispielsweise durch die in DE 
197 04 728.9 beschriebene Architektur erfolgen (vgl. DE 197 04 728.9, Fig. 
4). Die angekoppelten PAEs verarbeiten vorwiegend Daten beliebiger Art und 
besitzen AnschluS an weitere PAEs, insbesondere datenverarbei tende {ALU -PAEs) 
und/ oder Speicher- PAEs (RAM- PAEs) und/ Oder peripbere Anschlttsse (10-PAEs) . 
10 Diese PAEs konnen durch die durch SEQ_OUT darges tell ten Control-Signale 
angesteuert werden und kflnnen bedarfsweise durch die an SEQ_IN geleiteten 
Zus tands signal e Ablauf speicher des Sequenzers ansteuern. 

15 Weitere mOglicherweise auch unabhangige PAEs oder Einheiten, insbesondere 

auch ext erne /per iphere Einheiten und/ oder ubergeordnete CTs kdnnen durch den 
Sequenzerspeicher entsprechend SEQ_IN/O0T angesteuert werden (CTRI>_OuT) oder 
dies en ansteuern (CTRL_IN) . 

20 

Zur korrekten taktgesteuerten Ablauf steuerung des Sequenzers sind in 
Rttckkopplungspfade bevorzugt taktsynchronisierte Register eingebaut. 

Die RAM-PAE kann durch eine ubergeordnete Konf igurationseinheit konfiguriert 
25 werden, insbesondere kOnnen die Sequenzer funktionen durch den Inhalt der RAM- 
PAE konfiguriert und festgelegt werden. 

Es wurde als vorteilhaf t erkannt und wird fur sich als patentfahig gehalten, 
dass mit einera Speicher ein einfacher Sequenzer ohne grofien zusatzlichen 

30 Hardwareaufwand realisiert wird. Dies ist besonders leicht dadurch mdglich, 
dass zunachst der Inhalt einer Speicherzelle dahingehend ausgewertet wird, an 
welcher Stelle als nachstes ein Lesezugriff erfolgen soil. Wenn dort wieder 
angegeben ist, wo als nachstes ein Zugriff erfolgt, ist ein autoraatenartiges 
Durchlaufen realisierbar . Zugleich wird aber gemSfi der hier als vorteilhaf t 

35 ' er kann ten Ausgestaltung nicht einfach eine weitere Adr esse fttr den nachsten 
Zugriff ermittelt, sondem parallel dazu angegeben, was dabei zu tun ist; mit 
anderen Worten werden an der Speicheradresse auch Daten oder Bef ehle 
mi tabgespei chert. Dies kann dadurch geschehen, dass ein Teil der an einer 
Stelle gespeicherten Information die Adresse fttr den nachsten Zugriff angibt 

40 und ein weitere Teil einen Befehl oder Daten darstellt. Dies ist ohne 

wei teres moglich, wenn die Breite der gespeicherten Daten aufgeteilt wird in 
einen Adressanteil und einen Daten/Bef ehlsanteil . Weiter ist es sogar 
moglich, nur einen Teil der im Speicher adressierbaren Speicherpiatze zu 
kodieren, etwa bei 12 bit Breite nur 8 bit zu verwenden. Dann kdnnen weitere 

45 Bits hinzugefttgt werden, hier vier, etwa durch Auswertung von Plags, 

Triggem, Zustanden, Oberlaufen etc. Dies hat den Vorteil, dass an die 
Speicherstellen, die dann exakt angesprochen werden durch Vorgabe der hier 
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Sbitigen ausgelesenen Adresse und der hier 4bit auswertegenerierten 
Information, unterschiedliche Anweieungen gesetzt werden kOnnen. Es sei 
darauf hingewiesen, dass entweder alle Trigger und die erforderliche Reaktion 
hierauf von vorneherein festlegbar sind oder dass alternativ auch zumindest 
5 Teile der Reaktionen auf einzelne oder alle Trigger wahrend der Ausfuhrung 
einer Konf iguration variiert und /oder festgelegt werden kOnnen. Hierzu kann 
eine Rtickkopplung auf eine Triggermaskierung usw. vorgesehen sein. 

Dies erlaubt es, abhangig von den ausgewerteten Inf ormationen bedingte 
10 SprUnge etc. zu generieren. Sind dabei von einer Reihe per- se auswertbarer 
Inf ormationen nur wenige interessant, werden also aktuell im obigen Bex spiel 
etwa nur 2 statt vier Bite bentttigt, so kann die jeweils in einer 
entsprechenden Speichere telle angegebene Information an jenen Speicherstellen 
auch vorhanden sein, die eich nur urn nicht interessierende Bits in ihrer 
15 Adresse unterscheiden . 

Figur 15 zeigt ein Ausgestaltungsbeispiel eines erf indungsgemaSen Sequenzers 
basierend auf einer RAM-PAE. Ein Teil (1505) des Datenausgangs (1502) eines 
Speichers (1501) ist ttber ein taktgesteuertes Register (1503) auf den 
20 Adresseingang (1504) des Speichers ziirttckgekoppelt. Der Adresseingang (1504) 
entspricht somit CYCLE und 1505 einem Teil, bevorzugt dem HSherwertigen, von 
NEXT_CYCIiE. 

Optional kann ein Teil (1508) des Datenausgangs (1502) an eine Selektor- 
25 Maskeneinheit (1509, 1510) gefuhrt werden, in welcher die vom Bus system 0105 
als Daten und/oder Trigger eingehenden SEQ_IN (1511) bzw. CTRIlJCN (1512) 
Da ten verarbeitet werden. 

CTRL_IN und SEQ_IN und/oder deren in der Selek tor-Ma skeneinhei t verarbeitete 
30 Werte werden zu 1505 dazugemischt (1513), bevorzugt derart, dass 1505 den 
hBherwertigen Adressteil und CTRL_IN/SEQ_IN den niederwertigen bilden. 

Der verbleibende Teil des Datenausgangs (1502) kann in einen SEQL.0UT- (1506) 
und CTRLupTJT (1507) Teil aufgetrennt werden und tiber die Ausgabebaugruppen 
35 0803a, b als Daten und/oder Trig&er auf das Bussystem 0105 gefuhrt. 

Verschiedene Konf igurationsregistermodelle zur Festlegung der Konfiguration 
von jeweils lokal zugeordneten PAEs sind bekannt. In PACT02 ist ein 
sequentiell abarbeitbares Modell beschrieben, in PACT04 ist ein FIFO-Modell 
40 beschrieben, das ebenfalls sequentiell abgearbeitet und tiber 1 append 

konfiguriert werden kann, in PACT08 ist ein selektives Modell beschrieben, 
bei welchem abhangig von der Datenverarbeitung bestimmte 

Konfigurationsregister und damit die in ihnen gespeicherte Funktion und/oder 
Vemetzung ausgewahlt werden. In DE 100 28 397.7 ist weiterhin ein FIFO- 
45 Modell beschrieben, das sich besonders f0r die Vorabkonfiguration und 
ttberlappende Konfiguration eignet. 
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Als besonders leistungsfahig und Kosten/Performance effizient wurde eine 
Mischung aus diesen Mode 11 en erkannt. 

Das FIFO-Modell nach DE 100 28 397.7 eignet sich besonders, urn eine 
5 beliebige Anzahl von Konfigurationsregistem von PAEs vorzuladen, da die 
Funktion des verwendeten FIFOs eine variable Konf igurationelange effizient 
ermflglicht. Hierzu wird jeder PAS ein lokaler FIFO-Speicher zugeordnet, der 
die Konfigurationen seiner zugeordneten PAE verwaltet und puffert. 

10 Durch eine Erweiterung, wie z. B. die nachfolgend beschriebene, des FIFO- 
Model les kann der Anfang und das Ende einer bestimmten Konfiguration und der 
dazugeh&renden einzelnen Konf igurationseintrage festgestellt werden. Nunmehr 
kSnnen mehrere Konfigurationen zugleich in dem FIFO-Mbdell abgelegt werden. 

15 Als besonders geeignet zur Kennzeichnung des Anfangs oder Endes von 

Konfigurationen haben sich die zwei nachfolgend beschriebenen Verfahren 
herausges tell t : 

a) Kennzeichnung durch zusatzliche Bits (CycleBits) in jeder Speicherzelle: 
20 Jedem Konfigurationseintrag werden zusatzliche Bits zugeordnet, die den 
Beginn und/oder das Ende einer Konfiguration kennzeichnen. Beispielsweise 
kann ein Eintrag im FIFO wie folgt aussehen: 



Bit 0..15 


Bit 16 


Bit 17 


Konfigurationswort 


0=don , t 

care 

l=Beginn 


0=don't 

care 

l=Ende 


Da bevorzugt nach dem nachfolgend beschriebenen Verfahren direkt auf den 
Beginn von Konfigurationen gezeigt werden kann, wird bevorzugt auf die 
Anzeige des Beginns verzichtet: 


Bit 0..15 


Bit 16 




Konf igurationswort 


0=don * t 

care 

l=Ende 





b) Besonders effizient kann die Kennzeichnung durch besondere 
Konfigurationsworte sein, die als Befehle dekodiert werden; 
30 Bestimmte Bitkombinationen innerhalb des Konfigurationswortes werden als 
Befehle dekodiert und erkannt: 

Beispielsweise konnten die folgenden Befehle inplementiert sein: 
BEGIN : Beginn einer Konfiguration 
END : Ende einer Konfiguration 
35 Dieses Verfahren ist erheblich flexibler und leistungsfahiger als die 
Kennzeichnung durch CycleBits. 
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Zur einfachen Unterscheidung von Befehlen und Konf igurationen kann ahnlich 
den CycleBits ein Bit vorgesehen sein, das durch seinen Wert die Semantik der 
Konf igurationswortes bestimmt, beispielsweise wie folgt: 



Bit 0..15 


Bit 16 


Daten 


O=lnterpretation der Daten als 




Konfigurationswort 




l=Interpretation der Daten als 




Befehl 



5 Eine Konf igurat ion wird je Aufruf von ihrem Anfang bis zu ihrem Ende in die 
Konfigurationsregister einer PAE Obertragen. 



Durch eine optionale zusatzliche flbersetzungs- und Zuweisungsvorrichtung 
konnen Zustande (z.B. Zustande der eigenen ALU und/oder ein oder mehrere 
10 Trigger (vgl. DE 197 04 728.9 ) beispielsweise anderer PAEs) auf bestimmte 
Konf igurationen innerhalb des FIFO-Modells ubersetzt werden. Beispielsweise 
kann ein eintref fender Rekonf igurationstrigger auf eine bestimmte 
Konfiguration innerhalb des FIFO-Modells zeigen, die durch das Auftreten des 
Rekonf igurationstrigger dann konfiguriert wird. 

15 

Als Obersetzungs- und Zuweisungsvorrichtung konnen beispielsweise 
algehraische Berechnungen und/oder logische Verkntipfungen und/oder bevorzugt 
Obersetzungsspeicher (Lookup-Tabellen) zum Einsatz koramen. 

20 Wenn verschiedene Konf igurationen in einer oder fur eine oder eine Reihe von 
PAEs abgelegt werden, so bietet es sich an, die Adressen, an denen die 
jeweilige Information abgelegt ist, auf einfache Weise dadurch zu verwalten, 
dass die Langen der jeweiligen abgespeicherten Konf igurationen aufaddiert 
werden. Dies ist dann wichtig, wenn die Konf igurationen unterschiedliche 

25 Langen haben, etwa weil bei bestiramten Konf igurationen Busse und/oder 

Register, wie Vorwarts- und RUckwartsregister konf iguriert werden mussen und 
bei andere nur neue Funktionen der ALU einer PAE einzustellen sind, oder weil 
gleichzeitig Konfigurationsinfonnation fur zellexterne Einheiten mitverwaltet 
wird. 

30 

Es ist damit also moglich, einen Quasi -Fifocharakter zu in^>lementleren. Dann 
sollten Mittel zum Aufaddieren, insbesondere sukzessivem Aufaddieren von 
Konf igurat ionelangen, sowie dafur, bei Oberf lUssigwerden bestimmter 
Konf igurationen, etwa aufgrund von Abarbeitung etc., die betreffenden 
35 Bereiche freizugeben. Das Aufaddieren ist etwa problemfrei mit Addiererketten 
moglich. 

Diese Anordnung kann verwendet werden, urn in einer Zelle Konf igurationen zu 
verwalten bzw. wiederum einen Sequenzer zu implementieren . Wiederum kann so 
40 auf die Konf igurationen reagiert werden, dass sich Sprunge etc realisieren 
lassen. Es sei darauf hingewiesen, dass oben bereits erwahnt wurde, dass zur 
Realisierung von Sequenzem zwischen ALU- PAEs und/oder anderen 
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datenverarbei tenden Z ell en mit jeweils gegebenenfalls erweiterter 
Funktionalitat und Speicherzellen Steuer{Ccmnnand-)I>eitungen vorgesehen werden 
kSnnen. Es sei erwahnt, dass derartige Leitungen mit zugeordeten Steuerungen 
audi innerhalb einer einzelnen und fur sich autark seqeunzerfahigen PAE 
5 vorgesehen sein kOnnen. 

Bine besonders bevorzugte Variante ist in Figur 14 dargestellt und arbeitet 
wie folgt: 

10 Eine Kette von Addierem wird derart miteinander verbunden, dass das Ergebnie 
(SUMME) eines vorherigen Addierers (p) an einen nachfolgenden Addierer (p+1) 
als Operand weitergeleitet wird. Die Weiterleitung kann derart unterbrochen 
werden, dass anstatt des Ergebnisses eine 0 (Null) weitergeleitet wird. 
Als zweiter Operand ist jedem Addierer jeweils ein eigenes Registers 

15 zugeordnet, dessen Wert jeweils zur SUMME der vorherigen Stufen addiert wird. 
Jede der Stufen reprasentiert eine Konf iguration im Konfigurations-PIFO; in 
dem Register der jeweiligen Stufe ist die relative Startposition einer 
Konf iguration gespeichert. Die absolute Startposition laSt sich nun 
berechnen, indem samtliche relative Startpositionen der sich unterhalb im 

20 FIFO befindenden Konfigurationen auf addiert werden. Dies geschieht durch die 
Addiererketten, wie auch aus der Fig. Ersichtlich ist. 

Mit anderen Worten ist die relative Position als unterste Konf iguration im 
FIFO diejenige, deren Eintrag am Nachsten zum Ergebnisausgang der 
25 Addierer kette gespeichert ist. Sodann folgen alle weiteren relativen 
Positionen gemafi ihrer Anordnung im FIFO. 

Die Kette wird an der S telle durch einschleusen einer Null ans telle der SUMME 
unterbrochen, bei welcher die relative Position der selektierten 
30 Konf iguration erreicht ist. 

Das Ergebnis ist nunmehr der Offset zwischen dem I»esepointer des FIFOs, der 
auf die unterste Konf iguration zeigt, und der Startposition der selektierten 
Konf iguration . 

Somit ist die Sprungadresse zur selektierten Konfiguration einfach durch 
35 Addition von Zeiger und Offset berechenbar. 

Die Auswahl der selektierten Konfiguration kann durch unterschiedliche 
Verfahren in der Obersetzungs- und Zuweisungseinrichtung erfolgen. 
(a) Die eingehenden Trigger konnen priorisiert und dekodiert werden. 
40 (b) Die eingehenden Trigger werden tiber eine Lookup-Tabelle ubersetzt und 
danach mttglicherweise priorisiert und dekodiert. 

(c) Es der Menge aller Trigger werden einige ausgewahlt, z.B. Ober 
Multiplexer, die sodann entsprechend (a,b) weiterver arbeitet werden. 

45 Es soli besonders darauf hingewiesen werden, dass ein Trigger auch ein Vektor 
(TRIG-V) sein kann, wie in PACT 08 beschrieben. Der Vektor selbst kann zur 
weiteren Dekodierung verwendet werden, d.h. der Vektor selektiert die 
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Konfiguration. Dies ist insbesondere dann wichtig, wenn eine Wave- 
Rekonf iguration nach PACT08, PACT13, PACT 17 durchgeftihrt werden soil, bei 
welcher bevorzugt ein mit den Daten tibertragener Trigger-Vektor die nachste 
Konf iguration selektiert . 



Nach Oder wahrend der Konfiguration konnen Konfigurationen aus dem FIFO 
entfernt werden. Bevorzugt wird dabei die Referenzierung innerhalb der 
fibers etzungs- und Zuweisungsvorrichtung entsprechend angepasst. 

10 

Weiterbin kann das FIFO-Model 1 urn das Sequenzer-Verfahren nach DE 196 54 
846.2-53 (bzw, wie bei den anderen Schutzrechten, ohne separat erwahnt zu 
sein, deren parallele) oder bevorzugt das vorstehend beschriebene erweitert 
werden. Dazu werden beispielsweise Sprunge (GOTO), sowie zustandsabhangige 
15 und bedingte Sprunge (WAIT-GOTO, IF-GOTO) eingefuhrt. Sprunge kttnnen durch 
besondere CycleBits reprasentiert werden, oder bevorzugt als Befehle 
implementiert sein. 

Weiterhin kann ein Synchronisations anzeigeverfahr en verwendet werden, das 
20 anzeigt, wann eine bestimmte Konfiguration bzw. ein bestimroter Zyklus des 
Sequenzers beendet ist. Mit anderen Worten kann jeder Zyklus aus mehreren 
Konf igurations ein tragen bestehen. Zur Kennzeichnung kann beispielsweise nach 
DE 196 54 846.2-53 ein run/stop-Flag verwendet werden, wobei •run 1 
zusaramengehorende Konfigurationseintrage eines Zyklus kennzeichnet und 'stop 1 
25 den ersten Ein t rag eines nachfolgenden Zyklus; alternativ ist ist die 

Verwendung der vorstehend beschriebenen CycleBits moglich, die zwar eine 
etwas andere Semantik aufweisen, sich aber ansonst gleich verhalten. 

Alternativ Oder zusatzlich zu diesen Verfahren ktfnnen auch die ebenfalls aus 
30 den fruheren Anmeldungen des Anmelders bekannten Befehle WAIT und BEGIN Oder 
bevorzugt die vorstehend beschriebenen Befehle BEGIN und END verwendet 
werden. 

Durch 'stop* oder WAIT oder END wird das Ende eines Zyklus. gekennzeichnet, d. 
h. eine Konfiguration ist koraplett, kann ausgefuhrt und abgearbeitet werden. 
35 Nach Beendigung der Datenverarbeitung dieser Konfiguration wird der nachste 
Zyklus ausgefuhrt. 

Die Beendigung kann entsprechend sequent! eller Prozessoren durch einen Takt 
(Instruktionsseguenzing) definiert sein, und/oder entsprechend des 
40 Datenverarbeitungsprinzips der PACT-Prozessoren (P 44 16 881.0-53 , DE 196 54 
846.2-53 , Konfigurationsseguenzing) durch ein Statussignal (z. B. einen 
Trigger) definiert sein. 

Mit anderen Worten wird z.B. kann durch das Eintreffen eines Triggers 'stop 1 
45 tibersprungen werden und die nachfolgenden Konf igurationen konfiguriert 

werden. Alternativ oder zusatzlich kann der Befehl WAIT eingesetzt werden, 
der auf das Eintreffen eines Triggers. 
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Optional kann ein FIFO nicht nur die lolcal zugeordnete PAE ansteuern, sondem 
auch weitere, insbesondere umliegende oder zur selben Konfiguration gehOrende 
PAEs. 

5 

Optional kann der FIFO auch als eine dedizierte Einheit nach DE 196 54 846.2- 
53 ausgestaltet sein. 

Ausf tthrungsbeispiele : 
10 A) Ein eintref fender Trigger wird tiber eine tibersetzungs- und 

Zuweisungsvorrichtung auf eine im FIFO liegende Konfiguration (Kl) ubersetzt. 

Die Konfiguration (Kl) wird daraufhin in die PAE konfiguriert. Als Ende- 

Kennung kann beispielsweise ein WAIT-Befehl, ein END-Befehl oder das 

run/stop-Flag dienen. 
15 Ein nachfolgend eintref fender Trigger wird ttber eine tfbersetzungs- und 

Zuweisungsvorrichtung auf eine andere im FIFO liegende Konfiguration (K2) 

ttbersetzt. Diese Konfiguration (K2) wird daraufhin in die PAE konfiguriert. 

Kl und /oder K2 kBnnen nach erfolgter Konfiguration in die PAE aus dem FIFO 

gelCscht werden. 

20 

B) Ein eintref fender Trigger wird ttber eine flbersetzungs- und 
Zuweisungsvorrichtung auf eine im FIFO liegende Konfiguration (K3) ttbersetzt, 
die aus mehreren Zyklen (Cyl, Cy2, Cy3a, Cy3b, Cy4) besteht. Der erste Zyklus 
(Cyl) wird daraufhin in die PAE konfiguriert und ausgeftthrt. Als Ende -Kennung 

25 kann beispielsweise ein WAIT-Bef ehl oder das run/stop-Flag dienen. 

Ein nachfolgend eintref fender Trigger, der das Ausftthrungsende des Zyklus 
anzeigt, bewirkt die Konfiguration und das Ausftthren von Cy2. Cy2 endet mit 
zwei WAIT-GOTO-Befehlen (WAIT -GOTO (Trgl, Cy3a) ; WAIT -GOTO (Trg2, Cy3b) > 
(vgl. PACT04}, dies bewirkt, dass auf zwei unterschiedliche Trigger, die das 

30 Ausftthrungsende des Zyklus anzeigen, Trgl und Trg2 reagiert wird. Triff t Trgl 
ein, wird im nachsten Zyklus Cy3a konfiguriert und ausgeftthrt bzw. bei Trg2 
entsprechend Cy3b. 

Cy3a und Cy3b enden mit einem WAIT-GOTO (Trg, Cy4) . Bei eintref fen eines 
35 Trigger, der das Ausftthrungsende des Zyklus anzeigt, wird nach Cy4 gesprungen 
und die Konfiguration entsprechend konfiguriert und ausgeftthrt. 

Cy4 endet mit einem WAIT-GOTO (Trg, Cyl), wodurch bei eintref fen des Trigger, 
der das Ausftthrungsende des Zyklus anzeigt, der emeute sequentielle 
40 Durchlauf einer Schleife beginnen kann. Insoweit kann durch den Sprung auf 
Cyl ein Ringspeicher nach DE 196 54 846.2-53 zum Ausftthren von Schleifen 
gebildet werden, wobei solch ein Ringspeicher vorteilhaf t, aber nicht 
zwingend ist. 

45 Durch Eintref fen eines Triggers (Trg-x) kann die Schleife termini ert werden. 
Existiert ein Eintrag fttr Trg-x in der tibersetzungs- und 

Zuweisungsvorrichtung kann die Schleife jederzeit abgebrochen und die durch 
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Trg-x in der Ober set zungs- und Zuweisungsvorrichtung referenzierte 
Konfiguration (KX) ausgefOhrt werden. 

Bxistiert kein Eintrag, kann durch das explizite Verwenden von WAIT-GOTO 
(Trg-x, KX) Befehlen, z.B. zusammen rait WAIT-GOTO (Trg, Cyl) in Cy4 die 
5 Schleife zu bestimmte vorgegebenen Ausftihrungszeitpunkten terminiert werden. 

Pigur 13 zeigt beispielhaft einen Aufbau eines Konf igurationsbusses zur 
Konfiguration von PAEs (1001) durch eine Konf igurationseinheit (0106). Die 
Konfigurationseinheit sendet Konf igurationsdaten tiber ein Bus sys tern 1301 und 

10 ggf . Ober mehrere Registerstufen (1303, 1304) zur Verbesserung des 

Frequenz verbal tens und Ober den Kon t i gura t ionsda tenbus (0404) an die PAEs 
1001. Jede PAE dekodiert die angelegten Adressen und reagiert, sofem sie 
eelektiert wurde, auf die Datenubertragung des Busses. PAEs kOnnen ihrerseits 
Daten Gber 0404 Ober die Regi s t er -Mul tipl exer- S tuf en 1304 auf das Bus system 

15 aufschalten und die Konfigurationseinheit oder optional andere PAEs senden. 
Dies geschieht jeweils durch Obertragung der Adresse der Empf angseinheit. 
Die Rtlckubertragung der Daten an die Konfigurationseinheit erfolgt bevorzugt 
ebenfalls durch Registerstufen hindurch (1305), bis zum Dateneingangsbus der 
Konfigurationseinheit (1302). 

20 Die Funktionsweise des Konf igurationsbusses ist ebenfalls in DE 101 42 904.5 
und DE 100 28 397.7 beschrieben, die zu Of f enbarungszwecken volluraf anglich 
eingegliedert sind. 

Figur 14 zeigt den Aufbau eines erf indungsgemaSen FIFO -Model Is zur Steuerung 
25 der Rekonf iguration; hierbei wird darauf hingewiesen, dass sich insbesondere 
durch die Befahigung zur Durchf tihrung von Sprttngen das hier prasentierte 
Fifo-Modell von reinen Fifos aus dem Stand der Technik unterscheiden kann. Es 
wurde dennoch die per se im Stand der Technik belegte Bezeichnung verwendet, 
weil diese vom typischen, sprungfreien Betrieb ein besonders anschauliches 
30 Bild assoziieren lafit, Diese Einheit ist optional zu alien, insbesondere den 
in dieser Anineldungen beschriebenen, rekonf iguierbaren Zellen (PAEs) und in 
Figur 4 als Einheit 0406 dargestellt. 

Bin Speicher 1401 enthait die Konfigurationsdaten ftir die zugeordnete PAE. 
1402 ist der Konfigurationsdatenausgang zu den Konf igurationsregis tern der 

35 PAE (0405). Ober 1403, d.h. den Bus 0404, schreibt die Konfigurationseinheit 
Konfigurationen in den Speicher, die jeweilige Adresse wird durch den 
Schreibzeiger (1407) generiert, der pro Schreibvorgang urn den Wert 1 
verandert wird, je nach Arbeitsweise des FIFOs inkrementell oder 
dekrementell. Ein Star tadress -Pointer (1404) zeigt auf den ersten 

40 Konfigurationsdateneintrag im Speicher, wanrend ein weiterer Pointer (1405) 
auf den zu lesenden, bzw. an die PAE zu ttbertragenden, 

Konfigurationsdateneintrag zeigt. 1405 wird mit jeder Datenubertragung aus 
dem Speicher an die PAE urn den Wert 1 verandert, je nach Arbeitsweise des 
FIFOs inkrementell oder dekrementell. Die Datenubertragung findet so lange 
45 statt, bis das Ende der Konfiguration von einer 

Konfigurationsendeerkennungseinheit (1409) erkannt wird, bei spiel sweise 
anhand eines CycleBits oder Befehls (WAIT, END) . 
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Der realisierte FIFO entspricht nicht den normalen FIFOs nach dem Stand der 
Technik, die nur den Pointer 1405 aufweisen. Die Modifikation ermoglicht das 
Lesen beliebiger Konf igurationsdaten aus dem Speicher, wahrend durch den 
Pointer 1404 verhindert wird, dass evtl. noch benfltigte Konf igurationsdaten 
5 tlberschrieben werden. Dies geschieht durch das Erzeugen eines Full-Flags 
durch den Vergleich (1406) des Star tadr ess-Pointers 1404 rait dem 
Schreibzeiger (1407) . Wenn der Speicher voll ist, werden Schreibversuche der 
Konf igurationseinheit zuruckgewiesen, dies kann bevorzugt durch das aus 
PACT10 bekannte ACK/REJ-Protokoll erfolgen. Der Vergleicher 1406 gibt dazu an 
10 seinem Ausgang 1416 ein entsprechendes Reject-Signal an die 
Konf igurationseinheit aus bzw. gibt kein Ack aus. 

Ein beispielhafter Speicherinhalt von 1401 ist mit 1408 gezeigt. Der Speicher 
enth&lt 5 Konf igurationen (C0..C4). 1404 zeigt als Startpointer auf die erste 
15 Konfiguration CO. In diesem Beispiel zeigt 1405 auf den Beginn von 

Konfiguration C3. Die Zeigerposition berechnet sich aus dem Wert von 1404 
plus der Lange der Konfiguration CO plus der Lange der Konfiguration CI plus 
der Lange der Konfiguration C2. 

20 Eingehende Trigger (1431) werden uber eine in Figur 14a dargest elite 

Ubersetzungs- und Zuweisungseinrichtung (1432) auf Selekt-Signale (SC0..n, 
1433) ubersetzt, die die Adressierung der Konf igurationsdaten im Speicher 
steuern. Diese (Jbersetzungs- und Zuweisungseinrichtung kann fest vorgegeben 
ihre Zuweisung vornehmen, ist aber bevorzugt wahrend der Abarbeitung einer 

25 Konfiguration veranderlich, wozu geeignete Ruckkopplungen, Signalleitungen 
etc. vorzusehen sind. Besonders wenn die tJbersetzungs- und 
Zuweisungseinrichtung veranderlich ist, wird es bevorzugt, auch und/oder 
zusatzlich die der Zuordnung dienende Einheit 1434 wahrend der 
Datenverarbeitung veranderlich zu gestalten. Auch hierzu sind entsprechende 

30 Schaltungsanordnungen vorzusehen, wobei die Veranderung der Zuordnung 
insbesondere programmgesteuert ablaufen kann. Eine entsprechende, 
insbesondere programmgesteuerte Veranderung ist auch fttr die Einheit 1414, 
d.h. das Adressberechnungsadditionskettenmittel mOglich. Die diese 
Aktualisierung und/oder neue Verbal tenswei sen ausltfsenden Befehle werden 

35 bevorzugt in der Speichereinheit 1401 hierfur abgelegt. 

Je ein Register (1411), ein Addierer (1412) und ein Nullgenerator (1413), 
hier beispielhaft realisiert durch eine bitweise Und-Funktion, bilden ein 
Glied einer Kette (1414) zur Adressberechnung. Je ein Glied verwaltet den 

40 Offset einer Konfiguration. Die Aneinanderreihung der Glieder entspricht der 
Aneinanderreihung der Konf igurationen im Speicher 1401. Mit anderen worten 
wird entsprechend des Beispiels 1408 das erste Glied die Lange der 
Konfiguration CO aufweisen, also den Offset der auf 1404 addiert werden muss, 
um auf die Konfiguration CI zu zeigen. Das zweite Glied weist die Lange der 

45 Konfiguration CI auf, also den Offset der auf den Offset von CO und auf 1404 
addiert werden muss, um auf die Konfiguration C2 zu zeigen. Das dritte Glied 
weist die Lange der Konfiguration C2 auf, also den Offset der auf den Offset 
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von CO und auf den Offset von CX und auf 1404 addiert werden muss, urn auf die 
Konfiguration C3 zu zeigen. Und so weiter. 

Es wird anhand der Ausfuhrung ersichtlich, dass eine Kette von Additionen 
entsteht, deren Gliederanzahl der Position der Konfiguration im Speicher 

5 entspricht. Dies wird durch die Kette 1414 wie folgt realisiert: 

t)ber den Addierer wir jeweils der im Register gespeicherte Wert, also die 
Lange der jeweiligen Konfiguration, zu dem Brgebnis des vorherigen Gliedes 
dazuaddiert. Der Wert am Eingang der bitweisen Dnd-Funktion wird mit alien 
Ergebnisbits des Addierers verundet. 1st der Eingang also gleich 0, lief ert 

10 die Und-Funktion eine Binare 0 am Ausgang, urn die Addiererkette bei der 
auszuwShlenden Konfiguration abzubrechen, ansonsten den Wert des 
Addierersausgangs . 

Mit anderen Worten ist in die Register (1411) die GroSe der Konf igurationen 
15 in ihrer Reihenfolge im Speicher (1401) eingetragen. Die Selektsignale sind 
derart auf die Null -Generator en gefuhrt, dass die Konf igurations-GrOSen bis 
zur Startadresse der durch die Trigger (1431) referenzierten Konfiguration 
auf addiert werden. 

20 Somit addiert die Kette alle Langen von Konf igurationen, die vor der zu 

ladenden Konfiguration im Speicher 1401 liegen. Damit bildet sich ein Offset, 
der durch Addition (1415) mit der Startadresse (1404) auf die zu ladende 
Konfiguration zeigt. 

25 Die beschriebene Schaltung ist besonders leistungsfahig, da sie die 

Berechnung des Offsets und den Sprung innerhalb eines Taktes ermoglicht. 

In einer zweiten optionalen Kette (1421) kOnnen in Registern (1422) Befehle 
an die Konfigurationseinheit und/oder die PAE und/oder den 

30 Konfigurationsstack gespeichert werden. Sine Nullfunktion (1423), hier 

ebenfalls beispielhaft entsprechend der Nullfunktion 1413 realisiert, liefert 
eine Binare 0 in an ihrem Ausgang, sofem das Selekt-Signal nicht aktiv ist, 
d.h. die Konfiguration nicht ausgewahlt wurde, ansonsten den Registerinhalt 
(1422), also den Befehl. fiber eine Oder-Kette (1424) werden alle NUll- 

35 Funktionsausgange miteinander verodert, sodass der Befehl im Register 1422 
der aktuell selektierten Konfiguration am Ausgang (1425) der Kette anliegt. 

Der Befehl kann nunmehr zum LVschen von Bintragen im Speicher (1401) dienen, 
d.h einer der moglichen Befehle kann sein, dass bestimmte gespeicherte 

40 Konf igurationen geloscht werden sollen bzw. zum Oberschreiben freigegeben. 
Dies kann z.B. durch den Befehl FIiUSH erfolgen, der den Startzeiger (1404) 
mit dem Lesezeiger 1405 ladt und somit alle vor dieser Adresse liegenden 
Daten zum tJberschreiben freigibt. Dies ist insofern bevorzugt, als die so zu 
uberschreibenden Konf igurationen im fifoartigen Speicher i.d.R. alter sind 

45 und daber typisch ttberschrieben werden kdnnen, wahrend die jungeren 

Konf igurationen, die oftmals noch benotigt werden, weiter oben im quasi 
fifoartigen Speicher liegen werden. Ein weiterer bevorzugt implementierter 
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Befehl ist, dass neue Konf igurationen geladen werden sollen; dies ist dann 
wichtig, wenn das Erfordernis, eine bestiramte neue Konfiguration zu 
benBtigen, mit einer zumindest nicht geringen Wahrscheinlichkeit vorhergesagt 
werden kann. Dieser Befehl kann an eine 2 en t rale 
5 Konf igurationsverwaltungseinheit oder dergl. abgegeben werden; die 
Direktladung ist gleichfalls moglich, etwa bei Zuordnung von I/O- 
MBglichkeiten. Auch ist es bevorzugt, wenn sowohl der 
Konfigurationsanforderungsbefehl als aucb der Plush- bzw. 
Altkonfigurationspreisgabebefehl simultan ausftthrbar und/oder speicherbar 
10 sind. Es sei erwahnt, dass derartige Befehle wie Flush, Laden oder 

Flush/Laden auch in anderen Speicherbereichen bzw. -einheiten wie etwa 1401 
ablegbar sind und dafur nicht zwingend eine dedizierte Ei n heit wie 1421 
vorzusehen ist. Diese Verwendung einer per se bereits vorhandenen Einheit 
kann hardwaremaEig bevorzugt sein. 

15 

Weiterhin kann der Befehl ttber das Bussystem nach Figur 13 an die 
Konfigurationseinheit gesendet werden (1426). Beispielsweise kann der Befehl 
dort den Start einer bestimmten Konfiguration auslosen und/oder das Vorladen 
einer Konfiguration bewirken. 

20 

FLUSH, also das Loschen von Konf igurationen ist einer der wesentlichen 
bevorzugten Befehle der Einheit. Einerseits ist der Befehl sehr vorteilhaft 
fur die Ausfuhrung, andererseits weist er das Problem auf , dass sich bei 
dessen Ausfuhrung samtliche Adressen und Referenzen ver&ndern. 

25 Der FIFO wird 'get lushed', indem der StartPointer (1404) auf eine neue 

Startadresse gesetzt wird. Diese wird wie in Fig. 14 dargestellt bevorzugt 
auf den Beginn einer gespeicherten Konfiguration gesetzt, wobei der Beginn 
durch die vorab beschriebene Berechnung mittels des Offsets bestimmt wird. 
Alternativ oder zusatzlich kann der Zeiger auch auf einen bestimmten anderen 

30 Wert z.B. eine an den FLUSH-Befehle gekoppelte Konstante gesetzt werden. 
Weiterhin raflssen die beiden Ketten 1414 und 1421 *gef lushed" werden, damit 
die Adressberechnung der geanderten Positionen der Konf igurationen im 
Speicher 1401 entspricht. Dies geschieht jeweils durch (in Figur 14 nicht 
eingezeichnete) Multiplexer (1451) , durch die die Registerdaten der art 

35 vorwartsttbertragen werden, dass die nunmehr leer en ( "gef lushten" ) Olieder der 
Kette mit den Daten der nachf olgenden Glieder uberschrieben werden, und zwar 
derart, dass a) die Reihenfolge der Daten in der Kette unverandert bleibt und 
b) das erste Olied der Kette mit neuen Daten belegt ist und c) alle weiteren 
Daten in ihrer Reihenfolge linear und ohne Ltlcke in die Glieder nachfolgend 

40 dem Ersten geschrieben sind, vgl. hierzu Fig. 14a Es sei darauf hingewiesen, 
dass ttber die Multiplexer 1451 auch Daten betref fend die Konf igurationsgrofce 
von aufien an die entsprechenden Stellen (Size of Config l..n) geschrieben 
werden kdnnen. Es ist dabei abzuschatzeh, aber aus Grttnden der 
Zeichnungsubersichtlichkeit nicht dargestellt, dass jede Stelle einzeln 

45 ansprechbar bzw. adressierbar ist. Verwiesen wird insoweit auf die in 1434 
dargestellte Einheit 1435, die diese Stelle jeweils bestimmt. 
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Durch die Verschiebung innerhalb der Ketten sind nunmehr die Selekt-Signale 
(SC0..n) an die neue Lage der Daten in den Ketten anzupassen, damit wieder 
eine korrekte Zuordnung der Selekt-Signale zu der Of f setberechnung entsteht. 
Grundsatzlich stehen dazu mehrere Methoden zur Verfligung. Beispielsweise 
5 k6nnen 

a) Signale nach 1432 in 1434 binar kodiert (entsprechend der Punktion eines 
74LS148) werden, ein Offset, der der durch Flush entstandenen Verschiebung 
entspricht, wird subtrahiert und der entstandene Wert wird wieder dekodiert 
(entsprechend der Funktion eines 74LS139) um die Selekt-Signale 1433 zu 

10 generieren; 

b) Signale nach 1432 in 1434 mittels einer Lookup r Tabelle auf die Selekt- 
Signale 1433 ttbersetzt werden. Dazu ist die Lookup-Tabelle der durch Flush 
veranderten Positionslage in den Ketten anzupassen. 

15 Ein besonders bevorzugtes Verfahren fur die tJbersetzung der Signale soli 
detailliert beschrieben werden und entspricht der in 1434 eingezeichneten 
Vorrichtung: 

Ein erstes Schieberegister (1435) enthalt als einen Ein-Bit-Wert die Position 
des aktuell ersten freien, also unbenutzten, Gliedes in den Ketten 1414, 

20 1421. Dies geschieht f olgendermaJSen : Nach einem Reset wird das 

niederwertigste Bit im Schieberegister auf 1 gesetzt (dargestellt durch einen 
gefullten Kreis) . Das niederwertigste Bit (Bit 0) wird auf das unterste Glied 
in den Ketten referenziert . Mit jedera Schreibzugriff auf die Ketten, also mit 
jedem neuen speichern (FILL) einer Konf iguration nach 1401 schiebt das 

25 Schieberegister das gesetzte Bit (PBIT) um eine Position in Richtung des 

hOchstwertigen Bits und referenziert damit auf das jeweils nachfolgende Glied 
in den Ketten. Das hochstwertige Bit referenziert somit auf das hSchste Glied 
in den Ketten, also ist das Schieberegister so breit wie Glieder in den 
Ketten vorhanden sind. Mit jedem FLUSH schiebt das Schieberegister das Bit 

30 (PBIT) um genau so viele Positionen wie Glieder in den Ketten geldscht wurden 
in Richtung des niederwertigen Bits, 

Die ttbersetzungs- und Zuweisungseinrichtung (1432) ttbersetzt bei der PAE vom 
Bussystem (0105a, Fig. 4) eingehende Trigger der art, dass je Trigger ein 

35 genau ein Signal des ausgehenden Busses (1437) gesetzt ist. Jedem Signal ist 
ein Schieberegister (1436) derselben GrCfie wie 1435 zugeordnet. Es sind also 
eine Vielzahl von Schiebergistem 1436 (vorliegend dargestellt 1436a. . .1436c) 
vorhanden, wobei deren Anzahl der Anzahl der maximal zuiassigen 
unterschiedlichen Trigger signale entspricht und deren Lange d.h. Bitbreite 

40 der Anzahl der maximal zuiassigen Konfigurationen entspricht, also der Anzahl 
der Kettenglieder entspricht. Beira neuen Speichern einer Konf iguration (FILL) 
wird der Inhalt von 1435 vor dem Verschieben von PBIT in das Scheiberegister 
(1436) geschrieben, auf das der, der Konf iguration zugeordnete, Trigger 
zeigt; dargestellt durch einen Kreis. 

45 Bei einem Auf treten des Triggers auf dem Bus liefert das entsprechende 

ubersetzte Signal (1437) einen 1-Wert, wahrend alle anderen Signale einen 0- 
Wert liefern. Die Signale 1437 werden jeweils an Nullgeneratoren (1438), 
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aufgebaut aus einer bitweisen Und- Funktion gefuhrt. Alle Nullgeneratoren 
deren Eingangs signal von 1437 einen 0-Wert aufweist, liefern einen Nullvektor 
am Ausgang. Der Nullgenerator, dessen Eingangesignal von 1437 einen 1-Wert 
aufweist, ttbertragt den Inhalt des Schieberegisters 1436. Die Ausgange aller 
5 Nullgenerator en werden miteinander verodert (1439) , sodass die Selekt-Signale 
SC0..n (1433) entstehen. 

Durch diese Funktion zeigt nunmehr ein eingehender Trigger Ober die 
Nullfunktionen auf ein Schieberegieter 1436, dessen gesetztes Bit wiederum 
10 auf ein Glied in der Ketten (1414, 1421) zeigt. 

Bei einera Flush schieben die Schieberegister 1436 gleich dem Schieberegister 
1435 den gespeicherten Wert um genau so viele Positlonen, wie Glieder in den 
Ketten geloscht wurden, in Richtung des niederwertigen Bits. 1st nach dieser 
15 Operation der Inhalt eines Schieberegisters gleich Null, da das PBIT uber das 
niederwertigste Bit hinausgeschoben wurde, bedeutet dies, dass die vormals 
referenzierte Konf iguration gelttscht wurde. 

Liefert 1434 fur einen eingetrof fenen Trigger 1431 den Wert Null am Ausgang 
20 1433, ist eine Konf igurationsauf f orderung an die Konfigurationseinheit zu 
senden, um die fehlende Konf iguration zu laden oder ggf . auch ein 
Fehlerstatus an die Konfigurationseinheit zu melden. 

Die Obersetzung der eingehenden Trigger 1431 nach 1437 in 1432 kann nach 
25 mehreren Prinzipien erfolgend, die einzeln oder gemeinsam angewendet werden 
kfinnen , bei spi el swei s e : 

1. Dekoder entsprechend der Funktion eines 74LS148 

2. Round-Robin Arbiter (vgl. PACT10) 

3. Lookup-Tabelle (vgl. PACT10) 

30 Prinzipiell kann die Obersetzung dem in PACT10 beschriebenen Verfahren 
entsprechen (Round-Robin -Arbiter, LUT1) . 

Fehlt eine Obersetzungsvorschrift, beispielsweise bei der Anwendung von 
Iiookup-Tabellen, ist eine Konf igurationsauf f orderung an die 
Konfigurationseinheit zu senden, um die. fehlende Konf iguration zu laden oder 
35 ggf. auch ein Fehlerstatus an die Konfigurationseinheit zu melden. 

Eine weitere wesentliche Funktion des Konf igurationss tacks nach Figur 14 ist 
das Seguenzen uber Konf igurationen, was bedingte und unbedingte Sprunge 
innerhalb des Speichers 1401 bedeutet. Daher ist auch diese Funktion 
40 detailliert in Figur 14b beschrieben. 

Ein Befehlsdekoder (1462) erkennt bedingte und unbedingte Sprungbefehle in 
Konf igurationswor ten (1402) beim Lesen aus dem Speicher 1401. Einem 
Sprungbef ehl ist als Konstante die relative Sprungadresse zur aktuellen 
45 Position zugeordnet, die vom Befehlsdekoder dekodiert und ausgegeben wird 
(1463). Je nach Sprungrichtung ist der Wert positiv oder negativ. 
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Weiterhin ist als Konstante ein Vergleichswert (1469) rait den eintref fenden 
Triggern oder den Statusflags der PAE, beispielsweise die ALU-Flags zero, 
carry, negative, overflow, etc. oder die Speicher-Flags full, empty, etc, 
angegeben, in Abh&ngigkeit dessen bedingte Sprttnge durchgefOhrt werden. Diese 
5 wird an eine Vergleichseinheit 1464 ttbermittelt, die den Wert mit den Flags 
(1465) und/oder Triggern, die von dem Augang Obersetzungs- und 
Zuweisungseinrichtung (1437) und/oder direkt von dem Bussystem 0105 staramen, 
verglichen . 

10 Eine Steuereinheit (1466) generiert in Abhangigkeit des Befehles (bedingter 
oder unbedingter Sprung = "Type") und des Vergleichsergebnisses die 
Ansteuerung fur den Lesezeiger (1405) wie folgt: 

Unbedingter Sprung: Generiere "Set*, urn neue Adresse nach 1405 zu laden ; 
Bedingter Sprung, Vergleieh erfflllt: Generiere "Set", ura neue Adresse nach 
15 1405 zu laden; 

Bedingter Sprung, Vergleich nicht erfullt: Generiere "Count", um Adresse des 
nachfolgenden Befehles in 1405 zu berechnen. 

Das Setzen einer neuen Adresse geschieht durch Aufaddieren (1468) der 
20 relativen Sprungadresse (1463) zum aktuellen Wert von 1405. Ober einen 

Multiplexer (1467), der zwischen der aufaddierten neuen Adresse und der von 
1415 generierten Startadresse von Konfigurationen (1461) auswdhlt, wird die 
neue Adress bei Anliegen von "Set" in den Lesepo inter 1405 geschrieben. 

Die Arbeit sweise des Konf igurationstacks macht die Verwendung von 
Konfigurationseinheiten (CT) wie aus PACT10 und PACT17 bekannt weitgehend 
oboslet, vie 1 men r ist eine verteilte, parallele CT durch die 
Konf igurations stacks ents tanden . 

Zwei Aufgaben der CT k6nnen dabei jedoch bei einer solchen Einheit 
verbleiben : 

1. Das Laden der Konfigurationen aus einem Speicher, der chipintern oder 
-extern implementiert sein kann, als flttchtiger oder nicht fluchtiger 
(ROM, EPROM, EEPROM, Flash-ROM, etc) Speicher ausgestaltet sein kann 
und/oder ein Massenspeicher sein kann. Dies kann nunmehr durch ei n e n 
einfachen Mikrokontroller erfolgen, der Daten an die PAEs sendet und 
auf die zurtlckgemeldete Quittierung reagiert. Beispielsweise kann 
bevorzugt die Einheit aus PACT05 als Mikrokontroller bzw. der in 
PACT05 beschriebene Algorithmus eingesetzt werden. Das Laden mufi nicht 
mehr zwingend aktiv geschehen, sondem es ist ausreichend, wenn eine 
Einheit vorhanden ist, die auf das Konf igurationsanforderungskommando 
das Hereinholen der neuen Konfigurationsdaten in die jeweilige PAE 
bzw. deren zugeordneten Konfigurationsspeicher veranlasst. Dies kann, 
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etwa bei den vorstehend diskutierten 1/O-PAEs auch jene PAE selbst 
sein, die derzeit neue Konf igurationsdaten bendtigt. 

2. Die verbleibende Resteinbeit kann verwendet werden, um 
sicherzustellen, dass Rekonf igurationstrigger (WCT) in einer 
bestiimaten Reihenfolge sortiert durcb das Array laufen und/oder 
vorgeladene Konf igurationen in der erforderlichen Reihenfolge 
abgearbeitet werden und/oder noch nicht geladene, aber benOtigte 
Konf igurationen wie erforderlich angefordert und /oder geladen werden. 
Diese Rekonf igurationstriggerpriorisierung kann dazu verwendet werden, 
zu Priorisieren, auf welchen Rekonf igurationsanf orderungstrigger 
zuerst reagiert werden soil. Dies stellt die konfliktfreie Abarbeitung 
unterschiedlicher, mSglicher Konf igurationen sicher, indem lediglich 
festgelegt wird, welcher Trigger zunachst durch das Array lSuft. Wenn 
ein solcher Trigger eine bestimmte PAE betriff t, die auf dies en 
Trigger reagieren soil, wird sie sich dies merken, um dann als 
nachstes auf diesen Trigger reagieren zu kOnnen, sobald sie 
rekonf iguierbar ist. Es sei erwahnt, dass bevorzugt die einzelne Zelle 
oder ein Zellgebilde Oder dergl. nicht nur jene Trigger vormerkt, die 
unmittelbar nachfolgend abzuarbeitende Konfigurationen betreffen, 
sondern dass auch alle weiteren oder wenigstens mehrere, von dieser 
Zelle kttnf tig abzuarbeitenden Konfigurationen in ihrer Reihenfolge 
abgelegt werden kOnnen und/oder sollen, so dass jede Zelle oder 
Zellgruppe die Information aus den Triggervektoren erhalt und behalt, 
die sie zuktinftig und/oder aktuell betrifft. Damit wird die Filmo- 
Funktion der frtlheren CT OberflUssig und durch den Zeitverlauf der 
Triggervektoren ira wesentlichen ersetzt. 

3. Sofern nur ein Rekonf igurationstrigger verwendet wird, sind keine 
30 besonderen Ma&nahmen erforderlich. Wenn mehrere 

Rekonf igurationstrigger (WCT) auftreten k6nnen, mttssen diese ohne 
zeitliche Oberlagerung, also nacheinander in fester Reihenfolge und 
kreuzungsfrei durch das Array laufen, um Deadlocks zu verhindem. 

35 Die kann durch das in Pigur 16 dargestellte Verfahren sichergestellt werden, 
bei welchen durch Routing-Mafinahmen fur eine korrekte zeitliche Weiterleitung 
von WCT zu sorgen. Von einer zentralen Instanz (1603) werden mehrere WCT fur 
verschiedene PAEs (1601) generiert, die jedoch zeitlich aufeinander 
abgestimmt sein sollen. Die unterschiedlichen Entferoungen der 1601 in der 

40 Matrix fuhren zu unterschiedlichen Laufzeiten, bzw. Latenzzeiten. Dies wird 
in dem vorliegenden Beispiel durch das geeignete Einsetzen von Pipelinestuf en 
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(1602) durch den, dem Compiler zugeordneten Router, erreicht (vgl. PACT13 ) . 
Die sich dadurch ergebenden Latenzen sind rait dl-d5 angegeben. Es ist 
ersichtlich, da£ in Richtung des WCT-Flusses (1604) in jeder Stufe (Spalte) 
dieselben Latenzen auftreten. Beispielsweise ware 1605 nicht notwendig, da 
5 die Entfemung von 1606 von 1603 sehr gering ist. Da aber fur 1607 und 1608 
je ein 1602 aufgrund der durch die langere Distanz entstehenden Laufzeit 
eingefUgt werden mu£, wird 1605 zura Abgleich der Laufzeit notwendig. 
Die zentrale Ins tan z 1603 niramt von den PAEs eingehende 

Rekonfigurations trigger (1609) auf und priorisiert diese, um sie dann jeweils 
10 einzeln und nacheinander als WCT an das Array aus PAEs zu send en. Mit 

anderen Worten sendet eine PAE, die einen Rekonfigurations trigger generiert, 
diesen nicht direkt an andere PAEs weiter, sondem ausschlieSlich an die 
zentrale Instanz 1603. 

15 Die zentrale Instanz speichert eingehende Trigger und priorisiert diese. Dazu 
kann bevorzugt das aus PACT10 bekannt Verfahren des SCRR-ARB verwendet 
werden, wie es in Figur 8 PACT10 ausfOhrlich beschrieben ist. 
Samtliche erwahnten PACT-Schutzrechte sind zu Of fenbarungszwecken 
vollumfanglich eingegliedert. 
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Titel: 
5 Patentansprtlche 

1. Zellementefeld zur Datenverarbeitung mit Punktionszellen zur Ausftlhrung 
algebraischer und/oder logischer Funktionen und Speicherzellen, urn 
Information zu empfangen, abzuspeichem und/oder auszugeben, dadurch 

10 gekennzeichnet, dafi von den Punktionszellen eine Steuerverbindung zu den 

Speicherzellen gefuhrt 1st. 

2. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
dafi ein Prozessor, Coprozessor und/oder Microcontroller mit einer 

15 Vielzahl in Funktion und/oder Vemetzung rekonf igurierbarer und/oder 

vorgebbarer Einheiten wie Punktionszellen und/oder Speicherzellen bildet. 

3. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 
gekennzeichnet , daS die Funktionszellen als arithmetische Logikeinheiten 

20 gebildet sind. 

4. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
dafi die ari throe tischen Logikeinheiten als erweiterte ALUs gebildet sind. 

25 5. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 

gekennzeichnet, dafi die Speicherzellen zur flttchtigen und/oder nicht 
flttchtigen Datenspeicherung ausgebildet sind. 

6. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 
30 gekennzeichnet, dafi die Speicherzellen zur Abspeicherung von zu 

verarbeitenden Da ten und/oder von zu verarbei tenden Programmschritten 
ausgebildet sind. 

7. Zellementefeld zur Datenverarbeitung, dadurch gekennzeichnet, dafi die 
35 Speicherzellen dazu ausgebildet sind, abgespei chert e Inf ormationen auf 

Ansteuerung der sie steuemden Funktionszelle direkt und/oder indirekt 
auf einen zur Funktionszelle ftthrenden Bus zu geben. 

8. Zellementefeld nach einem der vorhergehenden Ansprtiche, worin zumindest 
40 einer Speicherzelle und/oder Funktionszelle Register zugeordnet sind, 

insbesondere ein Backward-Register, welches im Inf ormationsweg zwischen 
Speicherzelle und Funktionszelle angeordnet ist. 

9. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 

45 gekennzeichnet, dafi die Speicherzelle dazu angeordnet ist, Inf ormationen 

von der sie steuemden Funktionszelle, einer Eingabe-Ausgabe-Zelle 
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10 



und/oder einer sie nicht steuemden Zelle mit arithmetischer Logikeinheit 
zu empf angen . 

10. Zellementef eld nach einem der vorhergehenden AnsprUche, dadurch 
gekennzeichnet, dafi der Funktionszellen-Speicherzellen-Kombination 
zumindest ein Ein-Ausgabe-Mittel zugeordnet ist, um Informationen an eine 
exteme Einheit und/oder eine andere Funktionszelle, Funktionszellen- 
Speicherzellen-Kombination und/oder Speicher zelle zu senden und/oder von 
dieser zu empf angen . 

11. Zellementef eld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
daS das Ein-Ausgabe-Mittel gleichfalls zum Empfang von Steuerbefehlen 
aus der Funktions zelle ausgebildet ist. 

15 12. Zellementef eld nach einem der vorhergehenden AnsprUche, dadurch 

gekennzeichnet, dafi die Steuerung dazu ausgebildet ist, zumindest 
einige, bevorzugt alle der nachfolgenden Befehle zu fiber tragen und/oder 
die Speicherzelle bzw. Eingabe/Ausgabe-Zelle dazu ausgebildet ist, die 
folgenden Befehle zu dekodieren: DATA WRITE/READ, ADRESS POINTER 

20 WRITE/READ, PROGRAMMPOINTER WRITE /READ, PROGRAMMPOINTER INCREMENT, 

STACKPO INTER WRITE/READ, vorgenannte Befehle jeweils insbesondere fur 
intemen und/oder extern en Zugriff , PUSH, POP, OPCODE, FETCH. 

13. Zellementef eld nach einem der vorhergehenden AnsprUche, dadurch 

25 gekennzeichnet, dafi die Funktions zelle als alleiniger Master auf die 

Steuerverbindung und/oder das als Steuerungsverbindung dienende 
Bussegment zugreifen kann. 

14. Zellementef eld zur Datenverarbeitung nach einem der vorhergehenden 
30 Ansprttche, dadurch gekennzeichnet, da& die Funktionszelle zumindest 

einer von Speicherzelle und Ein-Ausgabezelle benachbart angeordnet ist. 

15. Zellementef eld nach einem der vorhergehenden AnsprQche, dadurch 
gekennzeichnet, dafi die Zelielemente multidimensional angeordnet sind, 

35 insbesondere matrixartig, wobei die Funktionszelle und/oder die 

benachbarte Speicher- bzw. Ein-Ausgabezelle aus einer oberen Reihe Daten 
empf angen und in eine untere Reihe Daten ausgeben kann, wobei in einer 
Reihe Busee vorgesehen sind und die Funktionszelle und zumindest eine 
Speicher- und/oder Ein-Ausgabezelle in ein und derselben Reihe liegen. 

40 

16. Verfahren zum Betrieb eines Zellelementef eldes , insbesondere 
multidimensional en Zellelementef eldes mit Funktions zellen zur AusfOhrung 
algebraischer und/oder logischer Funktionen und 

Informationsbereitstellungs zellen, insbesondere Speicher zellen und/oder 
45 Ein-Ausgabezellen zum Empfangen und/oder Ausgeben von In forma tionen 

und/oder Speichem derselben, dadurch gekennzeichnet, dafi zumindest eine 
der Funktions zellen Steuer befehle an zumindest eine 
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Informationsbereitstellungszelle ausgibt, dort im Ansprechen auf die 
Steuerbefehlinformation fur die Funktionszelle verarbeitet wird und die 
Funktionszelle dazu ausgebildet 1st, eine weitere Datenverarbeitung im 
Ansprechen auf aus der Informationsbereitstellungszelie bereitgestellte 
5 Information durchzuf (ihren , urn so sequenzerartig Da ten zu verarbeiten. 

17. Verfahren nach einem der vorhergehenden Ansprtiche, dadurch 

gekennzeichnet, dafi die Funktionszelle dazu ausgebildet ist, zumindest 

einige der Steuerbef ehle 
10 OPCODE FETCH, 

DATA WRITE INTERN, 

DATA WRITE EXTERN, 

DATA READ INTERN, 

DATA READ EXTERN, 
15 ADRESSPO INTER WRITE INTERN, 

ADRESSPOINTER WRITE EXTERN, 

ADRESS POINTER READ INTERN, 

ADRESS POINTER READ EXTERN, 

PROGRAMMPO INTER WRITE INTERN, 
20 PROGRAMMPO INTER WRITE EXTERN, 

PROGRAMMPOINTER READ INTERN, 

PROGRAMMPO INTER READ EXTERN, 

STACKPOINTER WRITE INTERN, 

STACKPOINTER WRITE EXTERN, 
25 STACKPOINTER READ INTERN, 

STACKPOINTER READ EXTERN, 

PUSH, 

POP, 

PROGRAMMPOINTER INCREMENT 
30 ausgibt und im Laufe Zelleraentbetriebs zumindest einige, insbesondere 

alle der oben genannten Steuerbef ehle wie erforderlich ausgibt. 



18. Datenverarbei tungsanordnung mit einem multidimensional en 
Feld • 

in Funktion und/oder Vemetzung konf igurier barer Zell el entente und 
dies en zugeordneten Konf igurationsvorhaltemitteln zum lokalen 
Konf igurations-Vorhal ten, 
dadurch gekennzeichnet, daS 
die Konf igurationsvorhaltemittel dazu ausgebildet sind, 
zumindest einen Teil der vorgehaltenen Konfigurationen 
nichtfluchtig vorzuhalten. 

19. Datenverarbei tungsanordnung mit einem multidimensional en 
45 Peld 

in Punktion und/oder Vernetzung konf igurierbarer Zellelemente und 
dies en zugeordneten Konfigurationsvorhaltemitteln zum lokalen 
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Konf igurations-Vorhal ten , 
dadurch gekennzeichnet , dafi 
die Konf igurationsvorhal tend tt el dazu ausgebildet sind, 
alle vorgehaltenen Konf igurationen 
5 nichtfltichtig vorzuhalten. 

20. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenver arbei tungsanordnungsanspruche, dadurch gekennzeichnet, dafi die 
Funktion grobgranular konf igurierbar ist. 

10 

21. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenver arbei tungsanordnungsanspruche , dadurch gekennzeichnet, dafi die 
Veraetzung grobgranular konf igurierbar ist. 

15 22. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenver arbei tungsanordnungsanspruche , dadurch gekennzeichnet, dafi als 
Zellelemente zumindest eines von ALUs, EAlUs, RAM-Zellen, I/O-Zellen, 
Logiblfccken vorgesehen sind. 

20 23. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenver arbei tungsanordnungsanspruche, dadurch gekennzeichnet, dafi jedem 
Zellelement ein eigenes Konf igurationsvorhal temittel zugeordnet ist. 

24. Datenverarbeitungsanordnung nach einem der vorhergehenden 

25 Datenver arbei tungsanordnungsanspruche, dadurch gekennzeichnet, dafi die 

Konf igurationsvorhal temittel dazu ausgebildet sind, eine Vielzahl von 
Konf igurationen vorzuhalten. 

25. Datenverarbeitungsanordnung nach einem der vorhergehenden 

30 Datenver arbei tungsanordnungsanspruche , dadurch gekennzeichnet, dafi 

mehrere fest vorgegebene nichtfltlchtige Konf igurationen im 
Konf igurationsvorhal temittel vorgegeben sind. 

26. Datenverarbeitungsanordnung nach einem der vorhergehenden 

35 Datenver arbei tungsanordnungsanspruche, dadurch gekennzeichnet, dafi die 

Anordnung dazu ausgebildet ist, eine wechselnde einer Vielzahl von 
vorgehaltenen Konf igurationen zu verwenden, insbesondere im Wege der 
Wave-Rekonfiguration Oder des lokalen Sequencing, 

40 27. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenver arbei tungsanordnungsanspruche, dadurch gekennzeichnet, dafi bei 
einigen Zellen im Betrieb mit veranderlichen Konf igurationen vers e hba r e 
Konf igurationsvorhal temittel vorgesehen sind. 

45 28. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenver arbei tungsanordnungsanspruche, dadurch gekennzeichnet, dafi als 
Konf igurationsvorhal temittel zunmindest eines aus ROM, EPROM, EEPROM, 
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Flash- Spei cher. Fuse-, Antifuse-programmierbare Speichermittel und/oder 
in insbesondere in oberen Lagen einer Siliziumstruktur fest vorgesehene 
Speichermittel gewahlt sind. 

5 29. Verfahren zur Herstellung einer dedizierten 

Datenverarbeitungsanordnung, dadurch gekennzeichnet, dafi ein 
multidimensionales Feld mit in Function und/oder Verne tzung 
konfigurierbaren Zellelemente und diesen zugeordneten 
Konfigurationsvorhaltemitteln zum lokalen Konf igurations-Vorhalten 
10 vorgegeben wird, bestimmt wird, welche Konf igurationen in diesen 

vorzuhalten sind, und dann nichtf luchtige Konf igurationsvorhaltemittel 
so vorgesehen werden, da£ sie zumindest einen Teil der vorgehaltenen 
Konf igurationen nichtf Itichtig vorhalten. 



15 30. Verfahren nach dem vorhergehenden Datenverarbeitungsanordnungsanspruch, 
dadurch gekennzeichnet, dafc von einem zur lauf zeitrekonf igurierbaren 
multidimensionalen Feld ausgegangen vrird. 



31 . Verfahren nach dem vorhergehenden Datenverarbeitungsanordnungsanspruch, 
20 dadurch gekennzeichnet, da£ zunachst von einem zur 

lauf zeitrekonf igurierbaren multidimensionalen Feld mit 
Rekonfigurationsbeschaltung ausgegangen wird und dann fur 
Rekonfiguration nichtbenOtigte Felder weggelassen werden. 

32. Datenverarbeitungsanordnung, insbesondere nach einem der vorhergehenden 
25 Anspruche, insbesondere Prozessor, mit einem Feld aus zur Laufzeit in 

Funktion und/oder Vemetzung datenverabeitenden rekonf igurierbaren 
Zellen, denen Speicher und eine Sequenzersteuerung zugeordnet ist, 
dadurch gekennzeichnet, dafi die Steuerung derart ausgebildet ist, daS 
sich ein vollstandiger und/oder limitierter Befehssatz ergibt. 

30 

33 . Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Anspruche, insbesondere Prozessor, mit einem Feld aus 
zur Lauf zeit in Funktion und/oder Vemetzung datenverabeitenden 

35 rekonfigurierbaren Zellen, mit einer ALU oder anderen logischen 

Verknupfungsbeschaltung und dieser zugeordnetem, insbesondere 
integriertem Speicher, dadurch gekennzeichnet, da£ der Speicher in 
einer anderen Halblei ter-Lage, insbesondere oberhalb der ALU oder 
anderen logischen Verknupfungsbeschaltung angeordnet ist. 

40 

34. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Anspruche, insbesondere Prozessor, mit einem Feld aus 
zur Lauf zeit in Funktion und/oder Vemetzung datenverabeitenden 
rekonfigurierbaren Zellen, von denen einige Speicher zwecken dienen, 

45 dadurch gekennzeichnet, dafi diese Zellen dazu ausgebildet sind, eine 

MMo und/oder DMA - Funktion zu realisieren. 
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35. Datenverarbeitungsanordnung, insbesondere nach einem der 

vorhergehenden Ansprttche, insbesondere Prozessor, mit einem Peld aus 
zur Lauf zeit in Funktion und/oder Verne tzung dat enverabei tenden 
5 - rekonfigurierbaren Zellen, dadurch gekennzeichnet, dafi wenigstens 

eine, bevorzugt zumindest einige, insbesondere bevorzugt nicht alle, 
Zellen eine Eingangs/Ausgangs funktion realisieren und bevorzugt 
zugleich eine ALU oder anderen logischen Verknlipf ungsbeschal tung zur 
Datenverarbeitung und/oder -veranderung aufweisen, wobei insbesondere 
10 Mittel vorgesehen sind, urn jedem EinganGs- und/oder Ausgangskanal eine 

definierte Adresse zuzuordnen, und/oder wobei 
Senderidentifkationsmittel vorgesehen sind. 



36. Datenverarbeitungsanordnung, insbesondere nach einem der 

15 vorhergehenden Ansprttche, insbesondere Prozessor, mit einem Feld aus 

zur Lauf zeit in Funktion und/oder Verne tzung datenverabei tenden 
rekonfigurierbaren Zellen, dadurch gekennzeichnet, dafi zumindest 
einige, bevorzugt nicht alle, Zellen f e in granular e FPGA-Strukturen 
aufweisen, wahrend andere Zellen grobgranulare Strukturen aufweisen. 

20 

37. Datenverarbeitungsanordnung nach dem vorhergehenden Anspruch, wobei 
eine Konfigurationseinheit zur schnellen Rekonfiguration der Zellen 
vorgesehen ist, dadurch gekennzeichnet, dafi die Konfigurationseinheit 
nur zur Konf iguration der grobgranularen und/oder der Nicht-FPGA- 

25 Zellen beschaltet ist. 

38. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Ansprttche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Verne tzung datenverabei tenden 

30 rekonfigurierbaren Zellen zur Verarbeitung von Da ten mit einer hOheren 

Bitbreite, dadurch gekennzeichnet, dafi die Zellen dazu ausgebildet 
sind, wahlweise Da ten mit einer htfheren Bitbreite oder Da ten mit 
geringerer Bitbreite zu verarbeiten, wobei dann mehrere Da ten mit 
geringerer Bitbreite simultan verarbeitbar sind, insbesondere nach Art 

35 eines SIMD-Rechenwerkes . 



Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Ansprttche, nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi zur Zelle hin oder von dieser weg fuhrende Busse 
teilbar sind, insbesondere urn mehrere Datenstrdme mit geringerer 
Bitbreite als der in der Zelle maximal bearbeitbaren Bitbreite 
unabhangig weiterleiten und/oder empfangen zu kcnnen. 

40. Datenverarbeitungsanordnung, insbesondere nach einem der 
45 vorhergehenden Ansprttche, nach dem vorhergehenden Anspruch, dadurch 

gekennzeichnet, dafi die Busverwaltung lokal in der Zelle erfolgt. 



39. 

40 
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41. Datenverarbeitungsanordnung insbesondere nach einem der vorhergehenden 
Ansprdche, dadurch gekennzeichnet , dag einer PAE ein Speicher zur 
Sequenzerrealisierung zugeordnet ist und die Adressbusse als 
Teiladresbusse aufteilbar sind. 

5 

42. Datenverarbeitungsanordnung insbesondere nach einem der vorhergehenden 
Ansprtlche, dadurch gekennzeichnet, daE einer PAE ein Speicher zur 
Seguenzerrealisierung zugeordnet ist und eine Anordnung vorgesehen 

10 ist, um bei Zugrif f auf eine Speichers telle sowohl Inf ormationen 

betref fend die Adresse einer Speichers telle fur den nachsten 
Speicher zugrif f zu bes tinmen als auch Daten und/oder Befehle zu 
ermitteln. 
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